Unicode: Porovnání verzí
Smazaný obsah Přidaný obsah
m typografie |
m Robot: vhodnější šablona dle žádosti ze dne 25. 4. 2020; kosmetické úpravy |
||
Řádek 1:
[[Soubor:New Unicode logo.svg|náhled|180px|Logo Unicode konsorcia]]
'''Unicode''' ({{
| titul = The Unicode Standard: A Technical Introduction
| url = http://www.unicode.org/standard/principles.html
| datum přístupu = 2010-03-16
}}</ref> Poslední verze je ''Unicode 12.0'' z roku 2019. Normu udržuje [[Unicode Consortium]]. Úspěch Unicode v unifikaci znakových sad vedl k jeho rozšíření a převládajícímu používání pro [[Internacionalizace a lokalizace|internacionalizaci a lokalizaci]] [[Software|počítačového softwaru]]. Unicode je implementován mnoha technologiemi, včetně moderních [[operační systém|operačních systémů]], [[Extensible Markup Language|XML]], [[Java (programovací jazyk)|programovacím jazykem Java]] a [[.NET]] Frameworkem firmy [[Microsoft]].
Řádek 32 ⟶ 33:
| příjmení = Němec
| jméno = Petr
| autor =
| odkaz na autora =
| spoluautoři =
| titul = Unicode Standard 7.0: přibližně 250 nových „smajlíků“
| periodikum = Root.cz
Řádek 40 ⟶ 41:
| url = http://www.root.cz/zpravicky/unicode-standard-7-0-priblizne-250-novych-smajliku/
| datum vydání = 2014-06-17
| ročník =
| číslo =
| strany =
| issn = 1212-8309
| datum přístupu = 2014-08-26
| datum aktualizace =
}}</ref>, celkem přidává 2834 nových znaků (327 do BMP, zbytek do Plane 1), zavádí 23 nových jazyků.<ref>[http://www.unicode.org/versions/Unicode7.0.0/ Unicode 7.0.0] na unicode.org, cit. 2014-08-26</ref>
* [http://www.unicode.org/versions/Unicode8.0.0/ Unicode '''8.0'''] (2015) – obsahuje celkem 120737 grafických znaků ve 129 písmech; zavádí podporu abecedy Ahom, anatolských hieroglyfů, abeced Hatran, Multani, [[Rovas]] a [[znakopis]]u, doplňuje 5771 unifikovaných [[CJK]] ideografů, sadu malých písmen pro slabičné písmo Cherokee a pět emoji modifikátorů pro odstíny kůže<ref>{{Citace elektronické monografie
Řádek 74 ⟶ 75:
== Architektura Unicode ==
=== {{Kotva|BMP}} Basic Multilingual Plane ===
Unicode byl původně navrhován jako 16bitová znaková sada, což se později (hlavně s ohledem na [[CJK|čínské znaky]]) ukázalo jako nedostatečné. Původní rozsah Unicode, tj. prvních 65 536 znaků, které jsou reprezentovatelné pomocí 16 bitů, se označuje jako BMP (Basic Multilingual Plane) – základní vícejazyčná rovina Unicode.
Řádek 80 ⟶ 81:
=== Roviny Unicode ===
Standard [[ISO/IEC 10646]] oproti Unicode zpočátku používal 31bitové kódování znaků, které umožňuje reprezentaci více než 2 miliard znaků. Toto množství se ukázalo být zbytečně velké, proto bylo v listopadu 2003 v souvislosti se zavedením kódování UTF-16 omezeno na rozsah 0 až 10FFFF<sub>16</sub> rozdělený na 17 tak zvaných '''rovin''' ({{
=== {{Kotva|Surrogate Pairs}} Náhradní páry ===
Znaky mimo BMP se v [[UTF-16]] kódují dvojicí speciálních kódů, které se nazývají '''zástupné''' nebo '''náhradní páry''' ({{
=== Skupiny Unicode ===
|