Unicode
Keywords: Unicode, ASCII, Codificación de caracteres, ISO, ISO-8859-1, Norma, Sistema de archivos, UTF-16
| Series Unicode |
| Unicode |
| UTF-7 |
| UTF-8 |
| UTF-16 |
| UTF-32 |
| SCSU |
| Punycode |
| BiDi |
| BOM |
| Consorcio |
| UCS |
| Unificación Han |
Unicode es una norma de codificación de caracteres. Su objetivo es asignar a cada posible carácter de cada posible lenguaje un número y nombre único, a diferencia de la mayor parte de los juegos ISO como el ISO-8859-1, que sólo definen los necesarios para un idioma o zona geográfica.
Unicode se representa con tres tipos de codificación, según el número de bits necesarios para identificar cada carácter (UTF-8, UTF-16, UTF-32). (UTF-8, UTF-16, UTF-32) permiten representar los mismos caracteres, y Unicode define la relación biyectiva entre los tres.
Actualmente coincide con el estándar ISO/IEC 10646. Su utilización más frecuente, UTF-8, es compatible con el juego de caracteres ASCII. El UTF8 tiene la ventaja de ser parcialmente compatible con los programas anteriores que funcionaban con caracteres de 8 bits.
Los sistemas Windows utilizan la codificación UTF16, en el sistema de archivos NTFS por ejemplo.
