Unicode: Porovnání verzí

Smazaný obsah Přidaný obsah
Bez shrnutí editace
m -chybné nbsp
Řádek 1:
[[Soubor:Unicode logo.svg|náhled|vpravo|180px|Logo Unicode konsorcia]]
'''Unicode''' ({{Vjazyce|en}} {{Cizojazyčně|en|''Unicode''}}) je [[technická norma]] pro&nbsp; oblast [[Výpočetní technika|výpočetní techniky]] definující konzistentní [[Znaková sada|kódování]] pro&nbsp; reprezentaci a&nbsp;zpracovávání [[Znak (počítače)|textů]] použitelné pro většinu [[Písmo|písem]] používaných v&nbsp;současnosti na&nbsp;Zemi. Unicode je vyvíjen v&nbsp;součinnosti s&nbsp;[[ISO/IEC 10646]] a&nbsp;je publikován elektronicky jako ''The Unicode Standard''. Nejnovější verze obsahuje repertoár více než 120&nbsp;000&nbsp;[[znak (počítače)|znaků]] pokrývajících 129&nbsp;moderních a&nbsp;historických [[Písmo|písem]] a&nbsp;mnoho sad symbolů. Standard sestává ze&nbsp; sady tabulek pro&nbsp; vizuální referenci, popisu metod kódování, sady referenčních datových [[soubor]]ů a&nbsp;dalších položek, jako například vlastností znaků, pravidel pro&nbsp; [[Unicode normalizace|normalizaci]] textů, dekompozici, [[Abecední řazení|řazení]], vykreslování a&nbsp;zobrazování [[obousměrný text|obousměrného textu]] (pro&nbsp; správné zobrazení textu obsahující písma psaná zprava doleva i&nbsp;zleva doprava, jako například [[arabské písmo|arabské]] a&nbsp;[[hebrejské písmo]]).<ref>{{Citace elektronické monografie
| titul = The Unicode Standard: A Technical Introduction
| url =http://www.unicode.org/standard/principles.html
| datum přístupu = 2010-03-16}}</ref> Poslední verze je ''Unicode 8.0''. Normu udržuje [[Unicode Consortium]].
 
Úspěch Unicode v&nbsp;unifikaci znakových sad vedl k&nbsp;jeho rozšíření a&nbsp;převládajícímu používání pro&nbsp; [[Internacionalizace a lokalizace|internacionalizaci a lokalizaci]] [[Software|počítačového softwaru]]. Unicode je implementován mnoha technologiemi, včetně moderních [[operační systém|operačních systémů]], [[XML]], [[Java (programovací jazyk)|programovacím jazykem Java]] a&nbsp;[[.NET]] Frameworkem firmy [[Microsoft]].
 
Unicode definuje několik způsobů reprezentace textů různými [[znakový kód|znakovými kódy]]. K&nbsp;nejpoužívanějším kódováním patří [[UTF-8]], [[UTF-16]] a zastaralé [[UCS-2]]. UTF-8 používá jeden [[bajt]] pro libovolný [[ASCII]] znak, přičemž všechny ASCII znaky mají v UTF-8 stejné kódové hodnoty jako ASCII a dva až čtyři bajty pro jiné znaky. UCS-2 používá 16bitové kódové jednotky (dva [[oktet (informatika)|8bitové bajty]]) pro každý znak, ale neumožňuje kódovat všechny znaky v&nbsp;aktuálním standardu Unicode. UTF-16 je rozšíření UCS-2, které pomocí dvou 16bitových jednotek (4&nbsp;×&nbsp;8&nbsp;bit) umožňuje kódovat všechny znaky z Unicode. V Číně se používá kódování [[GB 18030|GB18030]], které přebírá celý znakový repertoár Unicode, proto je také jedním ze způsobů kódování Unicode. Mapování GB18030 na UTF-32 je však netriviální (potřebuje převodní tabulku).