Dominando la Sintaxis XML: Referencias, Entidades y Documentos Bien Formados

Clasificado en Informática

Escrito el en español con un tamaño de 3,36 KB

Conceptos Fundamentales de XML

Referencias de Carácter en XML

XML soporta referencias de carácter, que permiten insertar cualquier carácter Unicode en un documento. La sintaxis para una referencia de carácter decimal es:

&#nnn;
  • Donde nnn es el número decimal Unicode del carácter a insertar.
  • Por ejemplo, el símbolo @ se escribiría @.

Entidades en XML

Una "entidad" consiste en un nombre y su valor, funcionando de manera similar a las constantes en los lenguajes de programación. Las entidades se definen en el prólogo de un documento XML.

  • Para definir una entidad, se utiliza la declaración <!ENTITY>.
  • Una vez definida, se hace referencia a ella en el cuerpo del documento escribiendo su nombre precedido del carácter & y seguido del carácter ;.
  • Ejemplo de definición de entidad:
    <!ENTITY IGN "Instituto Geográfico Nacional">
  • Ejemplo de referencia a una entidad:
    &IGN;

Documentos XML Bien Formados

Un documento XML debe estar bien formado, lo que significa que debe cumplir estrictamente las reglas de sintaxis definidas por la recomendación XML. Un documento bien formado consta de un prólogo (opcional) y un elemento raíz que contiene a todos los demás elementos.

Para que un documento XML se considere bien formado, debe cumplir los siguientes puntos clave:

  1. El documento contiene únicamente caracteres válidos según la especificación XML.
  2. Debe haber exactamente un elemento raíz que contenga a todos los demás elementos del documento.
  3. Los nombres de los elementos y de sus atributos no deben contener espacios en blanco.
  4. El primer carácter de un nombre de elemento o de atributo debe ser una letra, dos puntos (:) o un guion bajo (_).
  5. El resto de caracteres en un nombre de elemento o atributo pueden ser letras, números, guiones (-), puntos (.), dos puntos (:) o guiones bajos (_).
  6. Los caracteres especiales < (menor que) y & (ampersand) solo se pueden utilizar como comienzo de marcas (etiquetas o referencias de entidad/carácter).
  7. Las etiquetas de apertura, de cierre y vacías deben estar correctamente anidadas (no se solapan) y no debe faltar ni sobrar ninguna etiqueta de apertura o cierre.
  8. Las etiquetas de cierre deben coincidir exactamente con las de apertura, respetando el uso de mayúsculas y minúsculas (XML es case-sensitive).
  9. Las etiquetas de cierre no deben contener atributos.
  10. Ninguna etiqueta puede tener dos atributos con el mismo nombre.
  11. Todos los atributos deben tener un valor asignado.
  12. Los valores de los atributos deben estar siempre entre comillas (simples o dobles).
  13. Los valores de los atributos no deben contener referencias a entidades no declaradas o caracteres especiales sin escapar (ej. < o & deben ser &lt; y &amp; respectivamente).

Entradas relacionadas: