Le codifiche UCS-2 e UCS-4, pur includendo i caratteri ASCII, non sono strettamente compatibili con il codice ASCII, poiché usano un numero diverso di bit.
UTF (UCS Transformation Format) è un sistema di codifica dei caratteri Unicode e ISO 10646 compatibile con il codice ASCII; cioè, usando UTF per la codifica, possono sempre essere interpretati correttamente almeno gli eventuali caratteri ASCII presenti. Per ottenere questo risultato UTF usa un numero variabile di byte per rappresentare i caratteri.
La codifica UTF più usata è UTF-8.
Esiste anche UTF-16 che permette di codificare caratteri ISO 10646 in modo compatibile con Unicode; cioè usa 2 byte per i caratteri Unicode e più byte per gli altri caratteri.