ISO/IEC 10646: Porovnání verzí

Smazaný obsah Přidaný obsah
Garyczek (diskuse | příspěvky)
m přidáno odkaz na UTF-16
m oprava X-ti
Řádek 2:
UCS obsahuje znaky nutné k reprezentaci prakticky všech známých jazyků. Zahrnuje také množství grafických, [[typografie|typografických]], [[matematika|matematických]] a vědeckých symbolů. Podobným standardem je [[Unicode]], který definuje kompatibilní univerzální znakovou sadu.
 
'''ISO 10646''' definuje 31 bitovou znakovou sadu. Většina používaných znaků, včetně ostatních kódovacích standardů, je umístěna na prvních 65534 pozicích (0x0000 - 0xFFFD). Tato 16-ti bitová podmnožina se nazývá '''Basic Multilingual Plane (BMP)'''. Znaky později přidané mimo BMP jsou obvykle pro specifické aplikace, jako např. historické skripty a vědecké symboly. Současný záměr je, že se nebude používat kód znaku mimo 21 bitový prostor, tj. mimo interval 0x000000 až 0x10FFFF. To poskytuje daleko více než milion potenciálních znaků.
 
UCS každému znaku přiřazuje nejen číselný kód, ale i oficiální jméno. Hexadecimální číslo reprezentující UCS nebo [[Unicode]] hodnotu je obvykle uvedeno znaky „U+“, jako např. U+0041 je znak velké latinské písmeno A ''(Latin capital letter A)''. UCS znaky U+0000 až U+007F jsou shodné se znaky [[ASCII]] tabulky a interval U+0000 až U+00FF jsou shodné s kódem ISO-8859-1.