Kódování znaků: Porovnání verzí

Smazaný obsah Přidaný obsah
Učesání úvodu
Řádek 7:
 
== Proces standardizace ==
Po přijetí [[de facto standard]]ů [[Mezinárodní telegrafní abeceda č. 2|dálnopisných kódů]] bylo významným krokem standardizace vytvoření znakových kódů [[ASCII]] (1963) a [[EBCDIC]] (1964). Kód [[ASCII]] reprezentuje 33 [[řídicí znak|řídicích]] a 95 [[tisknutelný znak|tisknutelných znaků]] včetně malých a velkých [[písmeno|písmen]] anglické abecedy, [[číslice|číslic]] a dalších symbolů pomocí 7[[bit]]ových čísel; kód [[EBCDIC]] reprezentuje poněkud širší sadu znaků pomocí 8bitových čísel. Zatímco kód [[EBCDIC]] zůstal omezen na [[Mainframe|sálové počítače]] firmy [[IBM]] a jejich kopie, kód [[ASCII]] byl převzat různými národními i mezinárodními standardizačními organizacemi, například jako [[ISO/IEC 646]] nebo [[T.50]], a na jeho základě vzniklo množství národních variant používajících 7[[bit]]ové kódy. Jejich velkou nevýhodou bylo, že symboly, jejichž používání se mezitím rozšířilo, nahrazují národními znaky, takže při volbě nevhodného kódování se např. texty programů mohou proměnit v nečitelnou změť znaků. Většího rozšíření se proto dočkaly 8[[bit]]ové kódy, které zpravidla ponechávají kódy [[ASCII]] beze změn. Jedním 8[[bit]]ovým kódem však nelze reprezentovat [[latinka|latinku]], [[řecké písmo]], [[cyrilice|cyrilici]] (azbuku), [[arabské písmo|arabštinu]] a [[hebrejština|hebrejštinu]], ani pokrýt všechny znaky [[latinka|latinky]] s [[Diakritické znaménko|diakritickými znaménky]] používanými v různých jazycích. VýznamnéStandardizační organizace ISO definovala pro různé jazyky různá osmibitová kódování. Vlastní kódování také zavedly některé národní státy, nebo firmy jako [[Microsoft]], [[IBM]] a [[Apple]]. navícNedostatek vyvinulymísta vlastnív [[Osmibitový kód|osmibitovéosmibitových kódykódech]], kteréa přivedlyneschopnost kódovánídohody národníchtak vedly k mnoha problémům při používání znaků namimo pokrajsadu chaosuASCII. NejednotnostTento osmibitových kódovánístav spolu s potřebou jednotné reprezentace asijských [[Písmo|písem]] včetně rodiny [[CJK]] vedly okolo roku 1990 k vytvoření standardů [[Unicode]] a [[ISO 10646]], vyvíjenýchkteré jsou vyvíjeny ve vzájemné součinnosti,. jejichžTím postupněbyl uskutečňovanýmvytvořen záměremjednotný je vytvořit jednotnézáklad kódovaní pro reprezentaci všech písem, používaných na planetě [[Země|Zemi]].
 
== Terminologie ==
Řádek 15:
 
== Jednoduché znakové sady ==
Konvenční znakové sady a kódování znaků byly shodné, stejný standard specifikoval, které znaky byly dostupné a současně jak mají být zakódovány v sekvencích kódových jednotek (obvykle jeden znak na kódovou jednotku). Z historických důvodů [[MIME]] a jiné systémy založené na těchto sadách používaly termín '''znaková sada''' i pro systémy pro kompletní kódování sekvencí znaků do sekvence bytůbajtů (oktetů).
 
== Moderní přístup ke kódování ==