Unicode: Porovnání verzí

Smazaný obsah Přidaný obsah
IMHO „firmy“ Microsoft.
„znaková sada“ je něco jiného; doplnění části (další kus příště, zatím jsem došel k 2BFF), chce to oddělit jinam, je to moc dlouhé; zbytek článku pořád potřebuje zásadní úpravy; základní rozdělení existujících sekcí
Řádek 87:
V souvislosti s jazyky jako je [[wachánština]], jejichž ortografie založené na [[latinka|latince]] používají několik znaků [[cyrilice]] či [[řecké písmo|řeckého písma]], byla řešena otázka, zda kvůli nim do Unicode přidat znaky jako ''latinská [[delta (písmeno)|delta]]'', ''latinská [[théta]]'' či ''latinské [[Ы|jery]]'' jako latinské protějšky těchto řeckých a cyrilských písmen.<ref name="Jim Allan, Unicode">Jim Allan, [https://www.mail-archive.com/unicode@unicode.org/msg14260.html mixed-script writing systems], 2002-11-15, cit. 2014-08-27</ref> Jeden z názorů na tuto problematiku je, že požadavek, aby jazyk byl zapisován pouze znaky jednoho písma je umělý a že v minulosti si různé jazyky půjčovaly písmena i z jiných písem, takže na soubor písmen latinky, cyrilice a řeckého písma může být nahlíženo jako na latinsko-cyrilsko-řecké metapísmo a tedy pro zápis těchto jazyků používat písmena v Unicode již obsažené místo vytváření nových.<ref>Kenneth Whistler, [https://www.mail-archive.com/unicode@unicode.org/msg14261.html mixed-script writing systems], 2002-11-15, cit. 2014-08-27</ref> I v případě, kdy by tato písmena byla zavedena, lze očekávat, že by i nadále pro zápis byly používány řecké a cyrilské verze těchto písmen, protože latinské verze by byly obsaženy pouze v malém počtu fontů.<ref name="Jim Allan, Unicode" />
 
== Znakové sady UnicodeArchitektura ==
 
=== Bloky Unicode ===
{{RozdělitČásti|Bloky Unicode}}
<div style="-moz-column-count:3; column-count:3;">
* Základní [[Latinská abeceda|latinka]] (0000–007F)
* Doplněk základní latinky[[Latin-1]] (0080–00FF)
* Rozšíření latinky A (0100–017F)
* Rozšíření latinky B (0180–024F)
* [[Mezinárodní fonetická abeceda]] (0250–02AF)
* MezerovéModifikující znakypísmena se šířkou (02B0–02FF)
* KombinačníKombinující [[Diakritikadiakritika|diakritické]] značky (0300–036F)
* [[Řecká abeceda]] a koptské[[Koptské rozšířenípísmo]] (0370–03FF)
* [[Cyrilice]] (0400–04FF)
* Doplněk cyrilice (0500–052F)
Řádek 103 ⟶ 106:
* [[Arabské písmo]] (0600–06FF)
* [[Syrské písmo]] (0700–074F)
* Doplněk arabského písma (0750–077F)
* [[Thaana]] (0780–07BF)
* [[N'Ko]] (07C0–07FF)
* [[Samaritánské písmo]] (0800–083F)
* [[Mandejské písmo]] (0840–085F)
* Rozšíření arabštiny A (08A0–08FF)
* [[Dévanágarí]] (0900–097F)
* [[Bengálské písmo]] (0980–09FF)
Řádek 119 ⟶ 127:
* [[Barmské písmo]] (1000–109F)
* [[Gruzínské písmo]] (10A0–10FF)
* [[Hangul]] [[Jamo]] (1100–11FF)
* [[Etiopské písmo]] (1200–137F)
* Doplněk etiopštiny (1380–139F)
* Písmo [[CherokeeČerokézské písmo]] (13A0–13FF)
* Sjednocené slabiky kanadských domorodců (1400–167F)
* Sjednocená slabiková písma [[Původní obyvatelé Kanady|původních obyvatel Kanady]] (1400–167F)
* [[Ogam]] (1680–169F)
* [[Runy]] (16A0–16FF)
Řádek 133 ⟶ 142:
* Limbu (1900–194F)
* [[Tai Le]] (1950–197F)
* Nové Tai Le (1980–19DF)
* Khmerské symboly (19E0–19FF)
* [[Lontara]] (1A00–1A1F)
* Tai Tham (1A20–1AAF)
* Rozšíření kombinujících diakritických značek (1AB0–1AFF)
* [[Baliské písmo]] (1B00–1B7F)
* [[Sundánské písmo]] (1B80–1BBF)
* [[Batak]] (1BC0–1BFF)
* [[Lepcha]] (1C00–1C4F)
* [[Ol Chiki]] (1C50–1C7F)
* Doplněk sundánštiny (1CC0–1CCF)
* Védská rozšíření (1CD0–1CFF)
* Fonetické rozšíření (1D00–1D7F)
* Doplněk fonetických rozšíření (1D80–1DBF)
* Doplněk kombinujících diakritických značek (1DC0–1DFF)
* Dodatek rozšířené latinky (1E00–1EFF)
* Rozšíření řecké abecedy (1F00–1FFF)
* Všeobecné interpunkční znaménka (2000–206F)
* Horní a dolní indexy (2070–209F)
* Symboly peněžních měn (20A0–20CF)
* KombinačníKombinující diakritické značky pro symboly (20D0–20FF)
* PísmovéPísmenové symboly (2100–214F)
* Číselné formy (2150–218F)
* Šipky (2190–21FF)
* Matematické operátory (2200–22FF)
* Různé technické znaky (2300–23FF)
* ŘídicíObrázky obrázkyk řídicím znakům (2400–243F)
* Znaky pro [[OCR|optické rozpoznávání]] (2440–245F)
* UzavřenéOhraničené alfanumerické znaky (2460–24FF)
* Kreslení čarrámečků (2500–257F)
* Blokové prvky (2580–259F)
* Geometrické tvary (25A0–25FF)
Řádek 305 ⟶ 327:
==== Další kódování ====
Z různých důvodů existují také další méně často používaná kódování, jako jsou např. [[UTF-7]] či [[CESU-8]].
 
== Využití ==
 
=== Operační systémy ===
Řádek 328 ⟶ 352:
Na rozdíl od dřívějších osmibitových tabulek znaků jako je [[Kód Kamenických|bratří Kamenických]], [[Latin 2]], [[Windows-1250]] či [[ISO-8859-2]] lze všechny znaky zobrazit zároveň; v jednom textu lze tedy kombinovat např. [[Čeština|češtinu]] ([[latinka]]), [[Ruština|ruštinu]] ([[azbuka]]) a [[Řečtina|řečtinu]] ([[alfabeta]]).
 
==== Tabulka českých znaků Unicode ====
{| class="wikitable"
!znak