Nel 1993 l’ISO ha definito un nuovo standard per la codifica dei caratteri chiamato ISO 10646 e la relativa codifica UCS-4 (Universal Character Set a 4 byte).
Per la codifica vengono usati 4 byte, con il primo bit a 0, quindi effettivamente 31 bit (che permettono di rappresentare 231 caratteri cioè 2.147.483.648).
Nello standard ISO 10646 un blocco di 256 posizioni di codifica successive viene chiamato riga, 256 righe costituiscono un livello e 256 livelli un gruppo (in tutto ci sono 128 gruppi).
Il livello 00 del gruppo 00 è un livello speciale chiamato Basic Multilingual Plane (BMP), i cui caratteri sono identici a Unicode. Tuttavia la codifica UCS-4 non è strettamente compatibile con Unicode poiché usa 4 byte; il codice della lettera A per esempio è 00000041h.
Stringa da codificare
ciao
Codifica
00000000000000000000000001100011 00000000000000000000000001101001 00000000000000000000000001100001 00000000000000000000000001101111
In esadecimale
00000063h 00000069h 00000061h 0000006Fh