Di fatto, solo per l’inglese, il latino e la lingua swahili sono sufficienti i 128 caratteri di base permessi dal codice ASCII a 7 bit; tutte le altre lingue hanno bisogno di altri caratteri; anche l’italiano per esempio usa le lettere accentate che non sono comprese tra i caratteri di base.
Il bit più significativo degli 8 bit del codice ASCII di base può essere usato per estendere il codice e aggiungere altri 128 caratteri (con 8 bit si hanno 256 combinazioni diverse con valori da 0 a 255).
Non esiste un unico codice ASCII a 8 bit ma ne esistono diversi, chiamati anche tabelle di codici (per esempio si usa una tabella di codici diversa per ogni lingua che usa un diverso alfabeto).
Tutti i codici ASCII a 8 bit comunque sono compatibili con il codice ASCII a 7 bit, cioè i primi 128 caratteri sono identici.
L’ISO ha regolamentato queste estensioni con la serie di standard ISO 8859 che copre quasi tutte le estensioni dell’alfabeto latino come gli alfabeti cirillico (8859-15), arabo (8859-6), greco (8859-7) ed ebraico (8859-8); lo standard 8859-1 (chiamato anche ISO Latin-1) contiene i caratteri dell’alfabeto latino più esteso in grado di rappresentare molte lingue europee ed è stato riconosciuto come ASCII esteso a 8 bit.
Stringa da codificare
ciao
Codifica
01100011 01101001 01100001 01101111
In esadecimale
63h 69h 61h 6Fh