Unicode: Porovnání verzí
Smazaný obsah Přidaný obsah
IMHO „firmy“ Microsoft. |
„znaková sada“ je něco jiného; doplnění části (další kus příště, zatím jsem došel k 2BFF), chce to oddělit jinam, je to moc dlouhé; zbytek článku pořád potřebuje zásadní úpravy; základní rozdělení existujících sekcí |
||
Řádek 87:
V souvislosti s jazyky jako je [[wachánština]], jejichž ortografie založené na [[latinka|latince]] používají několik znaků [[cyrilice]] či [[řecké písmo|řeckého písma]], byla řešena otázka, zda kvůli nim do Unicode přidat znaky jako ''latinská [[delta (písmeno)|delta]]'', ''latinská [[théta]]'' či ''latinské [[Ы|jery]]'' jako latinské protějšky těchto řeckých a cyrilských písmen.<ref name="Jim Allan, Unicode">Jim Allan, [https://www.mail-archive.com/unicode@unicode.org/msg14260.html mixed-script writing systems], 2002-11-15, cit. 2014-08-27</ref> Jeden z názorů na tuto problematiku je, že požadavek, aby jazyk byl zapisován pouze znaky jednoho písma je umělý a že v minulosti si různé jazyky půjčovaly písmena i z jiných písem, takže na soubor písmen latinky, cyrilice a řeckého písma může být nahlíženo jako na latinsko-cyrilsko-řecké metapísmo a tedy pro zápis těchto jazyků používat písmena v Unicode již obsažené místo vytváření nových.<ref>Kenneth Whistler, [https://www.mail-archive.com/unicode@unicode.org/msg14261.html mixed-script writing systems], 2002-11-15, cit. 2014-08-27</ref> I v případě, kdy by tato písmena byla zavedena, lze očekávat, že by i nadále pro zápis byly používány řecké a cyrilské verze těchto písmen, protože latinské verze by byly obsaženy pouze v malém počtu fontů.<ref name="Jim Allan, Unicode" />
==
=== Bloky Unicode ===
{{RozdělitČásti|Bloky Unicode}}
<div style="-moz-column-count:3; column-count:3;">
* Základní [[Latinská abeceda|latinka]] (0000–007F)
* Doplněk
* Rozšíření latinky A (0100–017F)
* Rozšíření latinky B (0180–024F)
* [[Mezinárodní fonetická abeceda]] (0250–02AF)
*
*
* [[Řecká abeceda]] a
* [[Cyrilice]] (0400–04FF)
* Doplněk cyrilice (0500–052F)
Řádek 103 ⟶ 106:
* [[Arabské písmo]] (0600–06FF)
* [[Syrské písmo]] (0700–074F)
* Doplněk arabského písma (0750–077F)
* [[Thaana]] (0780–07BF)
* [[N'Ko]] (07C0–07FF)
* [[Samaritánské písmo]] (0800–083F)
* [[Mandejské písmo]] (0840–085F)
* Rozšíření arabštiny A (08A0–08FF)
* [[Dévanágarí]] (0900–097F)
* [[Bengálské písmo]] (0980–09FF)
Řádek 119 ⟶ 127:
* [[Barmské písmo]] (1000–109F)
* [[Gruzínské písmo]] (10A0–10FF)
* [[Hangul]] [[Jamo]] (1100–11FF)
* [[Etiopské písmo]] (1200–137F)
* Doplněk etiopštiny (1380–139F)
*
* Sjednocená slabiková písma [[Původní obyvatelé Kanady|původních obyvatel Kanady]] (1400–167F)
* [[Ogam]] (1680–169F)
* [[Runy]] (16A0–16FF)
Řádek 133 ⟶ 142:
* Limbu (1900–194F)
* [[Tai Le]] (1950–197F)
* Nové Tai Le (1980–19DF)
* Khmerské symboly (19E0–19FF)
* [[Lontara]] (1A00–1A1F)
* Tai Tham (1A20–1AAF)
* Rozšíření kombinujících diakritických značek (1AB0–1AFF)
* [[Baliské písmo]] (1B00–1B7F)
* [[Sundánské písmo]] (1B80–1BBF)
* [[Batak]] (1BC0–1BFF)
* [[Lepcha]] (1C00–1C4F)
* [[Ol Chiki]] (1C50–1C7F)
* Doplněk sundánštiny (1CC0–1CCF)
* Védská rozšíření (1CD0–1CFF)
* Fonetické rozšíření (1D00–1D7F)
* Doplněk fonetických rozšíření (1D80–1DBF)
* Doplněk kombinujících diakritických značek (1DC0–1DFF)
* Dodatek rozšířené latinky (1E00–1EFF)
* Rozšíření řecké abecedy (1F00–1FFF)
* Všeobecné interpunkční znaménka (2000–206F)
* Horní a dolní indexy (2070–209F)
* Symboly
*
*
* Číselné formy (2150–218F)
* Šipky (2190–21FF)
* Matematické operátory (2200–22FF)
* Různé technické znaky (2300–23FF)
*
* Znaky pro [[OCR|optické rozpoznávání]] (2440–245F)
*
* Kreslení
* Blokové prvky (2580–259F)
* Geometrické tvary (25A0–25FF)
Řádek 305 ⟶ 327:
==== Další kódování ====
Z různých důvodů existují také další méně často používaná kódování, jako jsou např. [[UTF-7]] či [[CESU-8]].
== Využití ==
=== Operační systémy ===
Řádek 328 ⟶ 352:
Na rozdíl od dřívějších osmibitových tabulek znaků jako je [[Kód Kamenických|bratří Kamenických]], [[Latin 2]], [[Windows-1250]] či [[ISO-8859-2]] lze všechny znaky zobrazit zároveň; v jednom textu lze tedy kombinovat např. [[Čeština|češtinu]] ([[latinka]]), [[Ruština|ruštinu]] ([[azbuka]]) a [[Řečtina|řečtinu]] ([[alfabeta]]).
==== Tabulka českých znaků Unicode ====
{| class="wikitable"
!znak
|