Fundamentos de XML: conceptos, elementos y atributos para datos estructurados

Clasificado en Informática

Escrito el en español con un tamaño de 3,79 KB

Teoría XML

1. Introducción

XML, acrónimo de eXtensible Markup Language, es un formato estándar diseñado por el W3C a partir de SGML (Structured Generalized Markup Language) para representar datos estructurados de forma jerárquica, es decir, en forma de árbol.

  • Los documentos XML incluyen una serie de etiquetas que permiten crear documentos en los que los datos van siempre acompañados de sus metadatos correspondientes.
  • Aunque, a primera vista, un documento XML puede parecer similar a un documento HTML, existe una diferencia fundamental: mientras HTML está orientado a la presentación y contiene principalmente información de marcado para mostrar contenido, los documentos XML contienen fundamentalmente datos autodefinidos.

2. Conceptos y vocabulario

  • Documento XML: Un documento XML es un documento de texto plano (sin formato).
  • Procesador XML (XML parser): Cuando una aplicación necesita leer un documento XML, la aplicación recurre a un procesador XML.
    1. El procesador o intérprete XML lee el documento, analiza el contenido y le pasa la información en un formato estructurado a la aplicación.
  • Caracteres: Los documentos XML pueden estar codificados en distintos juegos de caracteres, por ejemplo ISO-8859-1, UTF-8, etc.
  • Marcas y contenido: El texto que contiene un documento XML se divide en marcas y contenido.
    1. Las marcas pueden ser de dos tipos: etiquetas o referencias a entidades.
    2. Todo lo que no son marcas es contenido.

3. Elementos

  • En un documento XML el elemento es la unidad básica de información.
  • Un elemento se define con sus etiquetas de inicio y fin, ambas obligatorias salvo en el caso de elementos vacíos que usan la forma abreviada.
  1. Las etiquetas van encerradas entre los caracteres < y >.

Un nombre de elemento debe comenzar con letra o con el carácter subrayado (guion bajo). Después puede escribirse cualquier conjunto de caracteres válidos excepto el espacio en blanco, los dos puntos, los símbolos de menor y mayor y la barra /.

  1. Un nombre de elemento no puede comenzar con las letras xml (esto se aplica sin distinción entre mayúsculas y minúsculas).

Un elemento puede contener a su vez a otros elementos.

3.1 Atributos

  • Los elementos de un documento XML pueden incluir atributos que los describan.
    1. Por ejemplo: el tipo de datos que contiene, los valores permitidos, etc.
  • Los atributos de un elemento deben especificarse en su etiqueta de inicio.
  • Dentro de un mismo elemento no puede repetirse el mismo atributo.
  • Un atributo está compuesto por un nombre y un valor.
  • El valor deberá ir entre comillas dobles o simples en función del contenido.
  1. Si en la información hay comillas dobles, el valor se enmarcará con comillas simples y viceversa.
Conceptos clave
  • Documento XML: texto plano que representa datos estructurados.
  • Procesador XML: componente que analiza y transforma el documento XML para su uso por aplicaciones.
  • Elementos y atributos: estructura básica para declarar y describir datos en XML.
  • Codificación: elegir el juego de caracteres adecuado (por ejemplo UTF-8) es importante para la interoperabilidad.

Entradas relacionadas: