Unicode: Porovnání verzí
Smazaný obsah Přidaný obsah
m Přidání šablony Commonscat dle ŽOPP z 28. 7. 2016; kosmetické úpravy |
m byte -> bajt (sjednocení) |
||
Řádek 7:
Úspěch Unicode v unifikaci znakových sad vedl k jeho rozšíření a převládajícímu používání pro [[Internacionalizace a lokalizace|internacionalizaci a lokalizaci]] [[Software|počítačového softwaru]]. Unicode je implementován mnoha technologiemi, včetně moderních [[operační systém|operačních systémů]], [[XML]], [[Java (programovací jazyk)|programovacím jazykem Java]] a [[.NET]] Frameworkem firmy [[Microsoft]].
Unicode definuje několik způsobů reprezentace textů různými [[znakový kód|znakovými kódy]]. K nejpoužívanějším kódováním patří [[UTF-8]], [[UTF-16]] a zastaralé [[UCS-2]]. UTF-8 používá jeden [[
== Historie ==
Řádek 135:
;Délka textu: Text je po převádění z osmibitového kódování Unicode 2× delší, ale bez přidání nějaké informační hodnoty. Výsledný text zabere víc místa při uložení a také další zpracování je pomalejší.
;Neslučitelnost s osmibitovým prostředím: Unicode text může mít znaky, které v "normálním", osmibitovém textu normálně nejsou a většinou mají speciální význam - jde především o binární nulu, kterou Unicode text může obsahovat jako vyšší
Každý znak má jednoznačný číselný kód a svůj název. Navíc Unicode definuje u každého znaku některé základní vlastnosti jako např. zda se jedná o písmeno, symbol atd., zda je písmeno [[majuskule|velké]] či [[minuskule|malé]] atp.
Řádek 175:
==== UCS-2 ====
UCS-2 je původní způsob zápisu Unicode znaků. Pro uložení dat se využívá posloupnost dvoubajtových částí. Konec textového řetězce může být označen například 16bitovým NULL, tedy 0x0000; je potřeba dát si pozor, že osmibitové NULL (0x00) se může objevovat v nižším nebo vyšším
==== Další kódování ====
|