Introducción a XML: Estructura, Sintaxis y Validación

Clasificado en Informática

Escrito el en español con un tamaño de 3,38 KB

¿Qué es XML?

XML (Extensible Markup Language) es un lenguaje de etiquetas (no de programación) para el almacenamiento e intercambio de información en forma de texto entre distintas plataformas. Es un metalenguaje, es decir, puede ser empleado para definir otros lenguajes, llamados dialectos XML.

Elementos

XML está formado por texto plano y marcas, con la siguiente sintaxis:

  • <etiqueta>texto</etiqueta>
  • Elementos vacíos: <etiqueta/> o <etiqueta></etiqueta>

Un elemento padre puede contener uno o más elementos hijos. Todo documento XML tiene un único elemento raíz, del cual descienden los demás. Su estructura es en forma de árbol invertido. Los elementos (etiquetas) son los que le dan estructura semántica al documento y pueden contener texto y otros elementos.

Normativa de Sintaxis

En un documento XML, todos los nombres de los elementos son case sensitive, es decir, sensibles a letras minúsculas y mayúsculas, teniendo que cumplir las siguientes normas:

  • Pueden contener letras minúsculas, letras mayúsculas, números, puntos ".", guiones medios "-" y guiones bajos "_".
  • Pueden contener el carácter dos puntos ":".
  • El primer carácter tiene que ser una letra o un guion bajo "_" (NO un número).
  • Detrás del nombre de una etiqueta se permite escribir un espacio en blanco o un salto de línea.
  • No puede haber un salto de línea o un espacio en blanco antes del nombre de una etiqueta.
  • Las letras no inglesas (á, Á, ñ, Ñ...) están permitidas. Sin embargo, es recomendable no utilizarlas para reducir posibles incompatibilidades con programas que puedan no reconocerlas.
  • En cuanto al carácter guion medio "-" y al punto ".", se recomienda no usarlos para reducir incompatibilidades o errores.

Atributos

Los atributos sirven para proporcionar información extra sobre el elemento que los contiene. Los nombres de los atributos deben cumplir las mismas normas de sintaxis que los nombres de los elementos.

  • Todos los atributos de un elemento tienen que ser únicos.
  • Los atributos contenidos en un elemento deben separarse por espacios.

Secciones CDATA

Un documento XML puede contener secciones CDATA (Character DATA) para escribir texto que no se desea que sea analizado. Se escribe comenzando con la cadena de caracteres "</strong>" y terminando con los caracteres "<strong>".

  • No se pueden anidar secciones CDATA.
  • No se pueden escribir espacios en blanco o saltos de línea en las cadenas de inicio "</strong>" o fin "<strong>".

Documentos XML Bien Formados y Válidos

Se dice que un documento XML está bien formado cuando no tiene errores de sintaxis. Por otro lado, es válido cuando, además de no tener errores de sintaxis, no incumple ninguna de las normas establecidas en su estructura.

Entradas relacionadas: