
- XML Tutorial
- XML - Home
- XML - Información General
- XML - Sintaxis
- XML - Documentos
- XML - Declaración
- XML - Las Etiquetas
- XML - Elementos
- XML - Los Atributos
- XML - Comentarios
- XML - Entidades de Caracteres
- XML - CDATA Las Secciones
- XML - Espacios en Blanco
- XML - Procesamiento
- XML - Codificación
- XML - Validación
- Avance XML
- XML - DTDs
- XML - Esquemas
- XML - Estructura de Árbol
- XML - DOM
- XML - Espacios
- XML - Bases de Datos
- Herramientas XML
- XML - Los Espectadores
- XML - Editores
- XML - Analizadores
- XML - Procesadores
XML - Codificación
Codificación es el proceso de convertir caracteres unicode en su equivalente representación binaria. Cuando el procesador XML lee un documento XML, codifica el documento según el tipo de codificación.Por lo tanto, tenemos que especificar el tipo de codificación en la declaración XML.
Tipos de codificación
Hay principalmente dos tipos de codificación:
- UTF-8
- UTF-16
UTF significa Formato de transformación UCS y UCS significa Conjunto de caracteres universal. El número 8 o 16 se refiere al número de bits utilizados para representar un carácter. Se trata de los de 8 (un byte) o 16 (dos bytes).Para los documentos sin información de codificación UTF-8, se establece de forma predeterminada.
Sintaxis
Tipo de codificación se incluye en el prólogo del documento XML. La sintaxis de codificación UTF-8 es la siguiente:
<?xml version="1.0" encoding="UTF-8" standalone="no" ?>
Sintaxis de codificación UTF-16
<?xml version="1.0" encoding="UTF-16" standalone="no" ?>
Ejemplo
Ejemplo siguiente muestra declaración de codificación:
<?xml version="1.0" encoding="UTF-8" standalone="no" ?> <contact-info> <name>Tanmay Patil</name> <company>TutorialsPoint</company> <phone>(011) 123-4567</phone> </contact-info>
En el ejemplo anterior encoding="UTF-8", especifica que 8 bits se utilizan para representar los caracteres. Para representar caracteres de 16 bits, UTF-16 codificación se puede utilizar.
Los archivos XML codificados con UTF-8 tienden a ser de menor tamaño que los codificados con formato UTF-16.