XML - Sintaxis



Este captulo le lleva a travs de la simple reglas de sintaxis para escribir un documento XML. Siguiente es un documento XML completo:

<?xml version="1.0"?>
<contact-info>

   <name>Tanmay Patil</name>
   <company>TutorialsPoint</company>
   <phone>(011) 123-4567</phone>
   
</contact-info>

Se puede observar que hay dos tipos de informacin en el ejemplo anterior:

  • Marcado, como en el caso de <contact-info> y
  • El texto o los datos de caracteres, tutoriales y (040) 123-4567.

El siguiente diagrama muestra las normas de sintaxis para escribir diferentes tipos de marcado y el texto de un documento XML.

Reglas de sintaxis XML

Veamos cada uno de los componentes del diagrama anterior en detalle:

Declaracin XML

El documento XML puede tener una declaracin XML. Est escrito, como se indica a continuacin:

<?xml version="1.0" encoding="UTF-8"?>

Donde versin es la versin de XML y la codificacin especifica la codificacin de caracteres usada en el documento.

Reglas de sintaxis de declaracin XML

  • La declaracin XML es sensible a maysculas y minsculas y debe empezar por "<?xml>" donde "xml" se escriben en minsculas.

  • Si el documento contiene declaracin XML, estrictamente tiene que ser la primera declaracin del documento XML.

  • La declaracin XML debe ser estrictamente la primera declaracin en el documento XML.

  • Un protocolo HTTP puede alterar el valor de la codificacin que se colocan en la declaracin XML.

Las etiquetas y elementos

Un archivo XML est estructurado por varios elementos XML, tambin llamado XML-nodos o las etiquetas XML. XML los nombres de los elementos estn encerrados por corchetes triangulares < > tal y como se indica a continuacin:
<element>

Las reglas de la sintaxis de las etiquetas y elementos

Sintaxis de Elemento: XML Cada elemento tiene que estar cerrada o con inicio o final con elementos como se muestra a continuacin:

<element>....</element>

O en simple de los casos, slo en esta forma:

<element/>

Anidamiento de elementos: un elemento XML puede contener varios XML de elementos como el de los nios, pero los nios no deben superponerse elementos, es decir, una etiqueta de cierre del elemento debe tener el mismo nombre que el de la ms reciente etiqueta de inicio sin precedentes.

Ejemplo siguiente muestra las etiquetas anidadas incorrecta:

<?xml version="1.0"?>
<contact-info>
<company>TutorialsPoint
<contact-info>
</company>

Ejemplo siguiente muestra la correcta las etiquetas anidadas:

<?xml version="1.0"?>

<contact-info>
   <company>TutorialsPoint</company>
<contact-info>

Elemento raz: Un documento XML slo puede tener un elemento raz. Por ejemplo, no es un documento XML correcto, ya que tanto los elementos x e y se producen en el nivel superior sin un elemento raz:

<x>...</x>
<y>...</y>

El ejemplo siguiente muestra un documento XML con formato correcto:

<root>
   <x>...</x>
   <y>...</y>
</root>

Maysculas y minsculas: Los nombres de los elementos XML son sensibles a las maysculas y minsculas. Esto significa que el nombre del punto de inicio y el final los elementos deben ser exactamente en el mismo caso.

Por ejemplo<contact-info> es diferente de<Contact-Info>.

Atributos

Un atributo especifica una propiedad para el elemento, utilizando un par nombre/valor. Un elemento XML puede tener uno o ms atributos. Por ejemplo:

<a href="http://www.tutorialspoint.com/">Tutorialspoint!</a>

Aqu href es el nombre del atributo y http://www.tutorialspoint.com/ es valor de atributo.

Reglas de sintaxis de atributos XML

  • Nombres de atributos en XML (a diferencia del HTML) son sensibles a maysculas. Es decir, HREF y href son dos diferentes atributos XML.
  • Mismo atributo no puede tener dos valores en una sintaxis. El ejemplo siguiente muestra sintaxis incorrecta porque el atributo b se especifica dos veces:
<a b="x" c="y" b="z">....</a>
  • Los nombres de los atributos se definen sin comillas, mientras que los valores de los atributos siempre debe aparecer entre comillas. Ejemplo siguiente muestra incorrecta sintaxis xml:
  • <a b=x>....</a>
    

    En la sintaxis anterior, el valor del atributo no est definido entre comillas.

    XML Referencias

    Por lo general las referencias que permiten agregar o incluir texto adicional o de marcado en un documento XML. Las referencias siempre comienzan con el smbolo "&" ,que es un carcter reservado y al final con el smbolo ";". XML tiene dos tipos de referencias:

    Referencias de entidad: Una referencia de entidad contiene un nombre entre el principio y el final delimitadores. Por ejemplo, &amp; donde amp es nombre. El nombre se refiere a la cadena de texto predefinidos y/o el marcado.

    Referencias de caracteres: Estos contienen referencias, como &#65;, contiene un hash (#) seguido de un nmero. El nmero se refiere siempre al cdigo Unicode de un carcter. En este caso, el 65 se refiere al alfabeto "A".

    Texto XML

    • Los nombres de elementos XML y XML-atributos son sensibles a las maysculas y minsculas, lo que significa que el nombre de inicio y fin elementos deben estar escritas en el mismo caso.
    • Para evitar problemas de codificacin, todos archivos XML debe ser guardado como Unicode UTF-8 o UTF-16 archivos.
    • Caracteres de espacio en blanco como los espacios en blanco, los tabuladores y line-breaks entre XML y entre los elementos XML-atributos sern ignorados.
    • Algunos caracteres estn reservados para la sintaxis XML. Por lo tanto, no se pueden utilizar directamente. Para utilizarlos, cierto grado de sustitucin de las entidades se emplean, que se enumeran a continuacin:
    Caracteres no permitidos Sustitucin de la entidad Descripcin del personaje
    < &lt; Menos de
    > &gt; Mayor que
    & &amp; AMPERSAND
    ' &apos; Apstrofe
    " &quot; Signo de interrogacin
    Advertisements