Unicode: Porovnání verzí

Smazaný obsah Přidaný obsah
m typografie
m Robot: vhodnější šablona dle žádosti ze dne 25. 4. 2020; kosmetické úpravy
Řádek 1:
[[Soubor:New Unicode logo.svg|náhled|180px|Logo Unicode konsorcia]]
'''Unicode''' ({{Vjazyce|en}} {{CizojazyčněVjazyce2|en|''Unicode''}}) je [[technická norma]] pro oblast [[Výpočetní technika|výpočetní techniky]] definující konzistentní [[Znaková sada|kódování]] pro reprezentaci a&nbsp;zpracovávání [[Znak (počítače)|textů]] použitelné pro většinu [[Písmo|písem]] používaných v&nbsp;současnosti na&nbsp;Zemi. Unicode je vyvíjen v&nbsp;součinnosti s&nbsp;[[ISO/IEC 10646]] a&nbsp;je publikován elektronicky jako ''The Unicode Standard''. Nejnovější verze obsahuje repertoár více než 120&nbsp;000&nbsp;[[znak (počítače)|znaků]] pokrývajících 129&nbsp;moderních a&nbsp;historických [[Písmo|písem]] a&nbsp;mnoho sad symbolů. Standard sestává ze sady tabulek pro vizuální referenci, popisu metod kódování, sady referenčních datových [[soubor]]ů a&nbsp;dalších položek, jako například vlastností znaků, pravidel pro [[Unicode normalizace|normalizaci]] textů, dekompozici, [[Abecední řazení|řazení]], vykreslování a&nbsp;zobrazování [[obousměrný text|obousměrného textu]] (pro správné zobrazení textu obsahující písma psaná zprava doleva i&nbsp;zleva doprava, jako například [[arabské písmo|arabské]] a&nbsp;[[hebrejské písmo]]).<ref>{{Citace elektronické monografie
| titul = The Unicode Standard: A Technical Introduction
| url = http://www.unicode.org/standard/principles.html
| datum přístupu = 2010-03-16
}}</ref> Poslední verze je ''Unicode 12.0'' z roku 2019. Normu udržuje [[Unicode Consortium]].
 
Úspěch Unicode v&nbsp;unifikaci znakových sad vedl k&nbsp;jeho rozšíření a&nbsp;převládajícímu používání pro [[Internacionalizace a lokalizace|internacionalizaci a lokalizaci]] [[Software|počítačového softwaru]]. Unicode je implementován mnoha technologiemi, včetně moderních [[operační systém|operačních systémů]], [[Extensible Markup Language|XML]], [[Java (programovací jazyk)|programovacím jazykem Java]] a&nbsp;[[.NET]] Frameworkem firmy [[Microsoft]].
Řádek 32 ⟶ 33:
| příjmení = Němec
| jméno = Petr
| autor =
| odkaz na autora =
| spoluautoři =
| titul = Unicode Standard 7.0: přibližně 250 nových „smajlíků“
| periodikum = Root.cz
Řádek 40 ⟶ 41:
| url = http://www.root.cz/zpravicky/unicode-standard-7-0-priblizne-250-novych-smajliku/
| datum vydání = 2014-06-17
| ročník =
| číslo =
| strany =
| issn = 1212-8309
| datum přístupu = 2014-08-26
| datum aktualizace =
}}</ref>, celkem přidává 2834 nových znaků (327 do BMP, zbytek do Plane 1), zavádí 23 nových jazyků.<ref>[http://www.unicode.org/versions/Unicode7.0.0/ Unicode 7.0.0] na unicode.org, cit. 2014-08-26</ref>
* [http://www.unicode.org/versions/Unicode8.0.0/ Unicode '''8.0'''] (2015) – obsahuje celkem 120737 grafických znaků ve 129 písmech; zavádí podporu abecedy Ahom, anatolských hieroglyfů, abeced Hatran, Multani, [[Rovas]] a [[znakopis]]u, doplňuje 5771 unifikovaných [[CJK]] ideografů, sadu malých písmen pro slabičné písmo Cherokee a pět emoji modifikátorů pro odstíny kůže<ref>{{Citace elektronické monografie
Řádek 74 ⟶ 75:
== Architektura Unicode ==
 
=== {{Kotva|BMP}} Basic Multilingual Plane ===
 
Unicode byl původně navrhován jako 16bitová znaková sada, což se později (hlavně s ohledem na [[CJK|čínské znaky]]) ukázalo jako nedostatečné. Původní rozsah Unicode, tj. prvních 65 536 znaků, které jsou reprezentovatelné pomocí 16 bitů, se označuje jako BMP (Basic Multilingual Plane) – základní vícejazyčná rovina Unicode.
Řádek 80 ⟶ 81:
=== Roviny Unicode ===
 
Standard [[ISO/IEC 10646]] oproti Unicode zpočátku používal 31bitové kódování znaků, které umožňuje reprezentaci více než 2 miliard znaků. Toto množství se ukázalo být zbytečně velké, proto bylo v listopadu 2003 v souvislosti se zavedením kódování UTF-16 omezeno na rozsah 0 až 10FFFF<sub>16</sub> rozdělený na 17 tak zvaných '''rovin''' ({{Vjazyce|en}} {{CizojazyčněVjazyce2|en|''plane''}}) po 65&nbsp;536 znacích (10000<sub>16</sub>). Celý rozsah kódů tak lze rozdělit na BMP (Plane 0), Plane 1, Plane 2, ... až Plane 16. Celková kapacita Unicode je tedy 1114112 kódových bodů.
 
=== {{Kotva|Surrogate Pairs}} Náhradní páry ===
 
Znaky mimo BMP se v [[UTF-16]] kódují dvojicí speciálních kódů, které se nazývají '''zástupné''' nebo '''náhradní páry''' ({{Vjazyce|en}} {{CizojazyčněVjazyce2|en|''surrogate pairs'', ''surrogates''}}). Kódy používané pro náhradní páry spadají do BMP a nejsou jim přiřazeny žádné znaky.
 
=== Skupiny Unicode ===