Unicode: Porovnání verzí

Smazaný obsah Přidaný obsah
ShadowRobot (diskuse | příspěvky)
m WPCleaner v1.43b - Fixed using WP:WCW (Odkaz shodný se svým popisem)
Bez shrnutí editace
Řádek 1:
[[Soubor:Unicode logo.svg|náhled|vpravo|180px|Logo Unicode konsorcia]]
'''Unicode''' ({{Vjazyce|en}} {{Cizojazyčně|en|''Unicode''}}) je [[technická norma]] pro &nbsp;oblast [[Výpočetní technika|výpočetní techniky]] definující konzistentní [[Znaková sada|kódování]] pro &nbsp;reprezentaci a&nbsp;zpracovávání [[Znak (počítače)|textů]] použitelné pro většinu [[Písmo|písem]] používaných v &nbsp;současnosti na &nbsp;Zemi. Unicode je vyvíjen v &nbsp;součinnosti s&nbsp;[[ISO/IEC 10646]] a &nbsp;je publikován elektronicky jako ''The Unicode Standard''. Nejnovější verze obsahuje repertoár více než 120 &nbsp;000 &nbsp;[[znak (počítače)|znaků]] pokrývajících 129 &nbsp;moderních a &nbsp;historických [[Písmo|písem]] a &nbsp;mnoho sad symbolů. Standard sestává ze &nbsp;sady tabulek pro &nbsp;vizuální referenci, popisu metod kódování, sady referenčních datových [[soubor]]ů a &nbsp;dalších položek, jako například vlastností znaků, pravidel pro &nbsp;[[Unicode normalizace|normalizaci]] textů, dekompozici, [[Abecední řazení|řazení]], vykreslování a &nbsp;zobrazování [[obousměrný text|obousměrného textu]] (pro &nbsp;správné zobrazení textu obsahující písma psaná zprava doleva i &nbsp;zleva doprava, jako například [[arabské písmo|arabské]] a &nbsp;[[hebrejské písmo]]).<ref>{{Citace elektronické monografie
| titul = The Unicode Standard: A Technical Introduction
| url =http://www.unicode.org/standard/principles.html
| datum přístupu = 2010-03-16}}</ref> Poslední verze je ''Unicode 8.0''. Normu udržuje [[Unicode Consortium]].
 
Úspěch Unicode v &nbsp;unifikaci znakových sad vedl k &nbsp;jeho rozšíření a &nbsp;převládajícímu používání pro &nbsp;[[Internacionalizace a lokalizace|internacionalizaci a lokalizaci]] [[Software|počítačového softwaru]]. Unicode je implementován mnoha technologiemi, včetně moderních [[operační systém|operačních systémů]], [[XML]], [[Java (programovací jazyk)|programovacím jazykem Java]] a &nbsp;[[.NET]] Frameworkem firmy [[Microsoft]].
 
Unicode definuje několik způsobů reprezentace textů různými [[znakový kód|znakovými kódy]]. K &nbsp;nejpoužívanějším kódováním patří [[UTF-8]], [[UTF-16]] a zastaralé [[UCS-2]]. UTF-8 používá jeden [[bajt]] pro libovolný [[ASCII]] znak, přičemž všechny ASCII znaky mají v UTF-8 stejné kódové hodnoty jako ASCII a dva až čtyři bajty pro jiné znaky. UCS-2 používá 16bitové kódové jednotky (dva [[oktet (informatika)|8bitové bajty]]) pro každý znak, ale neumožňuje kódovat všechny znaky v &nbsp;aktuálním standardu Unicode. UTF-16 je rozšíření UCS-2, které pomocí dvou 16bitových jednotek (4&nbsp;×&nbsp;8&nbsp;bit) umožňuje kódovat všechny znaky z Unicode. V Číně se používá kódování [[GB 18030|GB18030]], které přebírá celý znakový repertoár Unicode, proto je také jedním ze způsobů kódování Unicode. Mapování GB18030 na UTF-32 je však netriviální (potřebuje převodní tabulku).
 
Umožňuje současně používat různá písma při vícejazyčném zpracování textu v počítači a kóduje široké portfolio znaků pro profesionální zpracování textů v prakticky jakémkoli moderním i historickém jazyce. Nevýhodou unicode může být složitější zpracování, stejný text zabírá více prostoru na disku nebo v operační paměti počítače. Ovšem výhody univerzální znakové sady drtivě převažují, což je vidět mj. na tom, že starší osmibitové znakové sady jsou dnes definované jako podmnožiny Unicode.