Unicode

Keywords: Unicode, ASCII, Codificación de caracteres, ISO, ISO-8859-1, Norma, Sistema de archivos, UTF-16

Series
Unicode
Unicode
UTF-7
UTF-8
UTF-16
UTF-32
SCSU
Punycode
BiDi
BOM
Consorcio
UCS
Unificación Han

Unicode es una norma de codificación de caracteres. Su objetivo es asignar a cada posible carácter de cada posible lenguaje un número y nombre único, a diferencia de la mayor parte de los juegos ISO como el ISO-8859-1, que sólo definen los necesarios para un idioma o zona geográfica.

Unicode se representa con tres tipos de codificación, según el número de bits necesarios para identificar cada carácter (UTF-8, UTF-16, UTF-32). (UTF-8, UTF-16, UTF-32) permiten representar los mismos caracteres, y Unicode define la relación biyectiva entre los tres.

Actualmente coincide con el estándar ISO/IEC 10646. Su utilización más frecuente, UTF-8, es compatible con el juego de caracteres ASCII. El UTF8 tiene la ventaja de ser parcialmente compatible con los programas anteriores que funcionaban con caracteres de 8 bits.

Los sistemas Windows utilizan la codificación UTF16, en el sistema de archivos NTFS por ejemplo.

Enlaces externos

Keywords: Unicode, ASCII, Codificación de caracteres, ISO, ISO-8859-1, Norma, Sistema de archivos, UTF-16