ISO/IEC 10646: Porovnání verzí

Smazaný obsah Přidaný obsah
Bota47 (diskuse | příspěvky)
m robot přidal: es
Dinybot (diskuse | příspěvky)
m typobot: typografické korekce podle specifikace
Řádek 4:
'''ISO 10646''' definuje 31 bitovou znakovou sadu. Většina používaných znaků, včetně ostatních kódovacích standardů, je umístěna na prvních 65534 pozicích (0x0000 - 0xFFFD). Tato 16-ti bitová podmnožina se nazývá '''Basic Multilingual Plane (BMP)'''. Znaky později přidané mimo BMP jsou obvykle pro specifické aplikace, jako např. historické skripty a vědecké symboly. Současný záměr je, že se nebude používat kód znaku mimo 21 bitový prostor, tj. mimo interval 0x000000 až 0x10FFFF. To poskytuje daleko více než milion potenciálních znaků.
 
UCS každému znaku přiřazuje nejen číselný kód, ale i oficiální jméno. Hexadecimální číslo reprezentující UCS nebo [[Unicode]] hodnotu je obvykle uvedeno znaky "U„U+", jako např. U+0041 je znak velké latinské písmeno A ''(Latin capital letter A)''. UCS znaky U+0000 až U+007F jsou shodné se znaky [[ASCII]] tabulky a interval U+0000 až U+00FF jsou shodné s kódem ISO-8859-1.
 
Standard ISO 10646-1 byl poprvé publikován v roce [[1993]] a definuje architekturu UCS a obsah BMP. Druhá část ISO 10646-2 byla přidána v roce [[2001]] a definuje znaky mimo BMP. Nové znaky jsou průběžně přidávány, ale existující znaky nebudou nikdy měněny a jsou stabilní.
Řádek 13:
 
Všechny informační systémy nepotřebují nutně všechny vlastnosti UCS. Jsou proto definovány následující implementační úrovně ''(implementation levels)'':
*Level 1 - Kombinované znaky a "Hangul„Hangul Jamo"Jamo“ znaky (moderní korejská varianta abecedy) nejsou podporovány.
*Level 2 - Jsou podporovány pevně definované kombinované znaky.
*Level 3 - Jsou podporovány všechny UCS znaky, libovolné varianty kombinovaných znaků.