XML - Codificación



Codificación es el proceso de convertir caracteres unicode en su equivalente representación binaria. Cuando el procesador XML lee un documento XML, codifica el documento según el tipo de codificación.Por lo tanto, tenemos que especificar el tipo de codificación en la declaración XML.

Tipos de codificación

Hay principalmente dos tipos de codificación:

  • UTF-8
  • UTF-16

UTF significa Formato de transformación UCS y UCS significa Conjunto de caracteres universal. El número 8 o 16 se refiere al número de bits utilizados para representar un carácter. Se trata de los de 8 (un byte) o 16 (dos bytes).Para los documentos sin información de codificación UTF-8, se establece de forma predeterminada.

Sintaxis

Tipo de codificación se incluye en el prólogo del documento XML. La sintaxis de codificación UTF-8 es la siguiente:

<?xml version="1.0" encoding="UTF-8" standalone="no" ?>

Sintaxis de codificación UTF-16

<?xml version="1.0" encoding="UTF-16" standalone="no" ?>

Ejemplo

Ejemplo siguiente muestra declaración de codificación:

<?xml version="1.0" encoding="UTF-8" standalone="no" ?>
<contact-info>

   <name>Tanmay Patil</name>
   <company>TutorialsPoint</company>
   <phone>(011) 123-4567</phone>
   
</contact-info>

En el ejemplo anterior encoding="UTF-8", especifica que 8 bits se utilizan para representar los caracteres. Para representar caracteres de 16 bits, UTF-16 codificación se puede utilizar.

Los archivos XML codificados con UTF-8 tienden a ser de menor tamaño que los codificados con formato UTF-16.

Advertisements