Verze z 31. 5. 2020, 11:23 editovat Valdemar (diskuse \| příspěvky) Prověření uživatelé, Revertéři 64 092 editací m typografie ← Přejít na předchozí porovnání		Verze z 4. 6. 2020, 14:56 editovat zrušit editaci DvorapaBot (diskuse \| příspěvky) Roboti 424 265 editací m Robot: vhodnější šablona dle žádosti ze dne 25. 4. 2020; kosmetické úpravy Přejít na další porovnání →
Řádek 1: [[Soubor:New Unicode logo.svg\|náhled\|180px\|Logo Unicode konsorcia]] '''Unicode''' ({{~~Vjazyce\|en}} {{Cizojazyčně~~Vjazyce2\|en\|''Unicode''}}) je [[technická norma]] pro oblast [[Výpočetní technika\|výpočetní techniky]] definující konzistentní [[Znaková sada\|kódování]] pro reprezentaci a zpracovávání [[Znak (počítače)\|textů]] použitelné pro většinu [[Písmo\|písem]] používaných v současnosti na Zemi. Unicode je vyvíjen v součinnosti s [[ISO/IEC 10646]] a je publikován elektronicky jako ''The Unicode Standard''. Nejnovější verze obsahuje repertoár více než 120 000 [[znak (počítače)\|znaků]] pokrývajících 129 moderních a historických [[Písmo\|písem]] a mnoho sad symbolů. Standard sestává ze sady tabulek pro vizuální referenci, popisu metod kódování, sady referenčních datových [[soubor]]ů a dalších položek, jako například vlastností znaků, pravidel pro [[Unicode normalizace\|normalizaci]] textů, dekompozici, [[Abecední řazení\|řazení]], vykreslování a zobrazování [[obousměrný text\|obousměrného textu]] (pro správné zobrazení textu obsahující písma psaná zprava doleva i zleva doprava, jako například [[arabské písmo\|arabské]] a [[hebrejské písmo]]).<ref>{{Citace elektronické monografie \| titul = The Unicode Standard: A Technical Introduction \| url = http://www.unicode.org/standard/principles.html \| datum přístupu = 2010-03-16 }}</ref> Poslední verze je ''Unicode 12.0'' z roku 2019. Normu udržuje [[Unicode Consortium]]. Úspěch Unicode v unifikaci znakových sad vedl k jeho rozšíření a převládajícímu používání pro [[Internacionalizace a lokalizace\|internacionalizaci a lokalizaci]] [[Software\|počítačového softwaru]]. Unicode je implementován mnoha technologiemi, včetně moderních [[operační systém\|operačních systémů]], [[Extensible Markup Language\|XML]], [[Java (programovací jazyk)\|programovacím jazykem Java]] a [[.NET]] Frameworkem firmy [[Microsoft]]. Řádek 32 ⟶ 33: \| příjmení = Němec \| jméno = Petr \| autor = \| odkaz na autora = \| spoluautoři = \| titul = Unicode Standard 7.0: přibližně 250 nových „smajlíků“ \| periodikum = Root.cz Řádek 40 ⟶ 41: \| url = http://www.root.cz/zpravicky/unicode-standard-7-0-priblizne-250-novych-smajliku/ \| datum vydání = 2014-06-17 \| ročník = \| číslo = \| strany = \| issn = 1212-8309 \| datum přístupu = 2014-08-26 \| datum aktualizace = }}</ref>, celkem přidává 2834 nových znaků (327 do BMP, zbytek do Plane 1), zavádí 23 nových jazyků.<ref>[http://www.unicode.org/versions/Unicode7.0.0/ Unicode 7.0.0] na unicode.org, cit. 2014-08-26</ref> * [http://www.unicode.org/versions/Unicode8.0.0/ Unicode '''8.0'''] (2015) – obsahuje celkem 120737 grafických znaků ve 129 písmech; zavádí podporu abecedy Ahom, anatolských hieroglyfů, abeced Hatran, Multani, [[Rovas]] a [[znakopis]]u, doplňuje 5771 unifikovaných [[CJK]] ideografů, sadu malých písmen pro slabičné písmo Cherokee a pět emoji modifikátorů pro odstíny kůže<ref>{{Citace elektronické monografie Řádek 74 ⟶ 75: == Architektura Unicode == === {{Kotva\|BMP}} Basic Multilingual Plane === Unicode byl původně navrhován jako 16bitová znaková sada, což se později (hlavně s ohledem na [[CJK\|čínské znaky]]) ukázalo jako nedostatečné. Původní rozsah Unicode, tj. prvních 65 536 znaků, které jsou reprezentovatelné pomocí 16 bitů, se označuje jako BMP (Basic Multilingual Plane) – základní vícejazyčná rovina Unicode. Řádek 80 ⟶ 81: === Roviny Unicode === Standard [[ISO/IEC 10646]] oproti Unicode zpočátku používal 31bitové kódování znaků, které umožňuje reprezentaci více než 2 miliard znaků. Toto množství se ukázalo být zbytečně velké, proto bylo v listopadu 2003 v souvislosti se zavedením kódování UTF-16 omezeno na rozsah 0 až 10FFFF<sub>16</sub> rozdělený na 17 tak zvaných '''rovin''' ({{~~Vjazyce\|en}} {{Cizojazyčně~~Vjazyce2\|en\|''plane''}}) po 65 536 znacích (10000<sub>16</sub>). Celý rozsah kódů tak lze rozdělit na BMP (Plane 0), Plane 1, Plane 2, ... až Plane 16. Celková kapacita Unicode je tedy 1114112 kódových bodů. === {{Kotva\|Surrogate Pairs}} Náhradní páry === Znaky mimo BMP se v [[UTF-16]] kódují dvojicí speciálních kódů, které se nazývají '''zástupné''' nebo '''náhradní páry''' ({{~~Vjazyce\|en}} {{Cizojazyčně~~Vjazyce2\|en\|''surrogate pairs'', ''surrogates''}}). Kódy používané pro náhradní páry spadají do BMP a nejsou jim přiřazeny žádné znaky. === Skupiny Unicode ===

Unicode: Porovnání verzí