Unicode: Porovnání verzí

Smazaný obsah Přidaný obsah
m +Drobné opravy
+Znakové sady Unicode, -Aktualizovat
Řádek 1:
{{Aktualizovat}}
[[Soubor:Unicode logo.svg|thumb|right|180px|Logo Unicode konsorcia]]
'''Unicode''' ({{Vjazyce|en}} {{Cizojazyčně|en|''Unicode''}}) je [[technická norma]] pro oblast [[Výpočetní technika|výpočetní techniky]] definující konzistentní [[Znaková sada|kódování]] pro reprezentaci a zpracovávání [[Znak (počítače)|textů]] použitelné pro většinu [[Písmo|písem]] používaných v současnosti na planetě Zemi. Unicode je vyvíjen v součinnosti s [[ISO/IEC 10646]] a je publikován jako ''The Unicode Standard''. Nejnovější verze obsahuje repertoár více než 120000 [[znak (počítače)|znaků]] pokrývajících 129 moderních a historických [[Písmo|písem]] a mnoho sad symbolů. Standard sestává ze sady tabulek pro vizuální referenci, metody kódování, sady standardních kódování znaků, sady referenčních datových [[soubor]]ů a dalších příbuzných položek, jako například vlastností znaků, pravidel pro [[Unicode normalizace|normalizaci]] textů, dekompozici, [[Abecední řazení|řazení]], vykreslování a zobrazování [[obousměrný text|obousměrného textu]] (pro správné zobrazení textu obsahující písma psaná zprava doleva i zleva doprava, jako například [[arabské písmo|arabské ]] a [[hebrejské písmo]]).<ref>{{Citace elektronické monografie
Řádek 47 ⟶ 46:
 
V souvislosti s jazyky jako je [[wachánština]], jejichž ortografie založené na [[latinka|latince]] používají několik znaků [[cyrilice]] či [[řecké písmo|řeckého písma]], byla řešena otázka, zda kvůli nim do Unicode přidat znaky jako ''latinská [[delta (písmeno)|delta]]'', ''latinská [[théta]]'' či ''latinské [[Ы|jery]]'' jako latinské protějšky těchto řeckých a cyrilských písmen.<ref name="Jim Allan, Unicode">Jim Allan, [https://www.mail-archive.com/unicode@unicode.org/msg14260.html mixed-script writing systems], 2002-11-15, cit. 2014-08-27</ref> Jeden z názorů na tuto problematiku je, že požadavek, aby jazyk byl zapisován pouze znaky jednoho písma je umělý a že v minulosti si různé jazyky půjčovaly písmena i z jiných písem, takže na soubor písmen latinky, cyrilice a řeckého písma může být nahlíženo jako na latinsko-cyrilsko-řecké metapísmo a tedy pro zápis těchto jazyků používat písmena v Unicode již obsažené místo vytváření nových.<ref>Kenneth Whistler, [https://www.mail-archive.com/unicode@unicode.org/msg14261.html mixed-script writing systems], 2002-11-15, cit. 2014-08-27</ref> I v případě, kdy by tato písmena byla zavedena, lze očekávat, že by i nadále pro zápis byly používány řecké a cyrilské verze těchto písmen, protože latinské verze by byly obsaženy pouze v malém počtu fontů.<ref name="Jim Allan, Unicode" />
 
== Znakové sady Unicode ==
<div style="-moz-column-count:3; column-count:3;">
* Základní [[Latinská abeceda|latinka]] (0000–007F)
* Doplněk základní latinky (0080–00FF)
* Rozšíření latinky A (0100–017F)
* Rozšíření latinky B (0180–024F)
* [[Mezinárodní fonetická abeceda]] (0250–02AF)
* Mezerové znaky (02B0–02FF)
* Kombinační [[Diakritika|diakritické]] značky (0300–036F)
* [[Řecká abeceda]] a koptské rozšíření (0370–03FF)
* [[Cyrilice]] (0400–04FF)
* Doplněk cyrilice (0500–052F)
* [[Arménské písmo]] (0530–058F)
* [[Hebrejské písmo]] (0590–05FF)
* [[Arabské písmo]] (0600–06FF)
* [[Syrské písmo]] (0700–074F)
* [[Thaana]] (0780–07BF)
* [[Dévanágarí]] (0900–097F)
* [[Bengálské písmo]] (0980–09FF)
* [[Gurmukhí]] (0A00–0A7F)
* [[Gudžarátí (písmo)|Gudžarátí]] (0A80–0AFF)
* [[Urijské písmo]] (0B00–0B7F)
* [[Tamilské písmo]] (0B80–0BFF)
* [[Telužské písmo]] (0C00–0C7F)
* [[Kannadské písmo]] (0C80–0CFF)
* [[Malajálamské písmo]] (0D00–0D7F)
* [[Sinhalské písmo]] (0D80–0DFF)
* [[Thajské písmo]] (0E00–0E7F)
* [[Laoské písmo]] (0E80–0EFF)
* [[Tibetské písmo]] (0F00–0FFF)
* [[Barmské písmo]] (1000–109F)
* [[Gruzínské písmo]] (10A0–10FF)
* Hangul Jamo (1100–11FF)
* [[Etiopské písmo]] (1200–137F)
* Písmo [[Cherokee]] (13A0–13FF)
* Sjednocené slabiky kanadských domorodců (1400–167F)
* [[Ogam]] (1680–169F)
* [[Runy]] (16A0–16FF)
* [[Baybayin|Tagalog]] (1700–171F)
* Hanunoo (1720–173F)
* Buhid (1740–175F)
* Tagbanwa (1760–177F)
* [[Khmerské písmo]] (1780–17FF)
* [[Mongolské písmo]] (1800–18AF)
* Limbu (1900–194F)
* [[Tai Le]] (1950–197F)
* Khmerské symboly (19E0–19FF)
* Fonetické rozšíření (1D00–1D7F)
* Dodatek rozšířené latinky (1E00–1EFF)
* Rozšíření řecké abecedy (1F00–1FFF)
* Všeobecné interpunkční znaménka (2000–206F)
* Horní a dolní indexy (2070–209F)
* Symboly peněžních měn (20A0–20CF)
* Kombinační diakritické značky pro symboly (20D0–20FF)
* Písmové symboly (2100–214F)
* Číselné formy (2150–218F)
* Šipky (2190–21FF)
* Matematické operátory (2200–22FF)
* Různé technické znaky (2300–23FF)
* Řídicí obrázky (2400–243F)
* Znaky pro [[OCR|optické rozpoznávání]] (2440–245F)
* Uzavřené alfanumerické znaky (2460–24FF)
* Kreslení čar (2500–257F)
* Blokové prvky (2580–259F)
* Geometrické tvary (25A0–25FF)
* Různé symboly (2600–26FF)
* Symboly [[dingbat]] (2700–27BF)
* Různé matematické symboly A (27C0–27EF)
* Doplňující šipky A (27F0–27FF)
* [[Braillovo písmo]] (2800–28FF)
* Doplňující šipky B (2900–297F)
* Různé matematické symboly B (2980–29FF)
* Doplňující matematické operátory (2A00–2AFF)
* Různé symboly a šipky (2B00–2BFF)
* [[Koptské písmo]] (2C80–2CFF)
* Doplněk CJK radikálů (2E80–2EFF)
* Radikály Kangxi (2F00–2FDF)
* Ideografické popisné znaky (2FF0–2FFF)
* CJK symboly a interpunkční značky (3000–303F)
* [[Hiragana]] (3040–309F)
* [[Katakana]] (30A0–30FF)
* [[Bopomofo]] (3100–312F)
* Hangul kompatibilní Jamo znaky (3130–318F)
* Kanbun znaky (3190–319F)
* Rozšíření Bopomofo (31A0–31BF)
* Katakana fonetické rozšíření (31F0–31FF)
* Uzavřené CJK znaky a měsíce (3200–32FF)
* CJK kompatibilní (3300–33FF)
* CJK jednotné ideografické rozšíření A (3400–4DBF)
* I-ťing hexagramové symboly (4DC0–4DFF)
* CJK jednotné ideogramy (4E00–9FFF)
* Slabiky [[ioština|ioštiny]] (A000–A48F)
* Radikály ioštiny (A490–A4CF)
* [[Hangul]] slabiky (AC00–D7AF)
* Oblast pro soukromé použití (E000–F8FF)
* CJK kompatibilní ideogramy (F900–FAFF)
* Abecední prezentační formy (FB00–FB4F)
* Arabské prezentační formy A (FB50–FDFF)
* Variační selektory (FE00–FE0F)
* Kombinační poloznačky (FE20–FE2F)
* CJK kompatibilní formy (FE30–FE4F)
* Malé varianty forem (FE50–FE6F)
* Arabské prezentační formy B (FE70–FEFF)
* Znaky plné šířky a poloviční šířky (FF00–FFEF)
* Speciální (FFF0–FFFF)
* Slabičné znaky [[lineární písmo B|lineárního písma B]] (10000–1007F)
* Ideogramy [[lineární písmo B|lineárního písma B]] (10080–100FF)
* Egejské čísla (10100–1013F)
* Starořecká čísla (10140–1018F)
* Starověké symboly (10190–101CF)
* Znaky [[Disk z Faistu|Disku z Faistu]] (101D0–101FF)
* Lýkijské písmo (10280–1029F)
* Kárské písmo (102A0–102DF)
* Staroitalické písmo (10300–1032F)
* [[Gótské písmo]] (10330–1034F)
* [[Ugarské písmo]] (10380–1039F)
* [[Deseretské písmo]] (10400–1044F)
* [[Showova abeceda]] (10450–1047F)
* [[Somálské písmo]] (10480–104AF)
* Kyperské slabičné písmo (10800–1083F)
* Byzantské hudební symboly (1D000–1D0FF)
* Hudební symboly (1D100–1D1FF)
* Tai-Xuan-Jing symboly (1D300–1D35F)
* Matematické alfanumerické symboly (1D400–1D7FF)
* Jednotné ideografické rozšíření CJK B (20000–2A6DF)
* Doplněk kompatibilních ideogramů CJK (2F800–2FA1F)
* Značky (E0000–E007F)
* Doplněk různých selektorů (E0100–E01EF)
* Doplňující oblast pro soukromé použití A (F0000–FFFFF)
* Doplňující oblast pro soukromé použití B (100000–10FFFD)
</div>
 
=== Skupiny Unicode ===