Fundamentos de los Lenguajes de Marcas y Estructura XML
Clasificado en Informática
Escrito el en
español con un tamaño de 3,4 KB
Introducción a los Lenguajes de Marcas
¿Qué es un Lenguaje de Marcas (LM)? Es una forma de codificar un documento que incorpora etiquetas o marcas que contienen información adicional acerca de la estructura del texto o su presentación. No es un lenguaje de programación porque no tiene funciones aritméticas o variables, pero aporta funcionalidad.
En TeX se usa la barra invertida (\) para el inicio de una marca. Los símbolos de apertura y cierre (<) y (>) siempre tienen que cerrarse. Es importante destacar que un navegador no es lo mismo que un buscador; el buscador es un sitio web al cual ingresas a través de un navegador.
El lenguaje de marcas es muy diverso. Se utiliza para mensajería instantánea (XMPP), servicios web (WSDL, SOAP), páginas web (HTML, WML), sindicación de contenidos (RSS), etc.
Clasificación y características comunes de los lenguajes de marca
- Procedimiento: Enfocado hacia la presentación del texto; sin embargo, las marcas que formatean el texto son visibles para el usuario y permiten procesamiento. Ejemplos: TeX, Nroff y LaTeX.
- Presentación: Indica cómo ha de presentarse el documento. Las etiquetas de marcado suelen estar ocultas al usuario. Ejemplo: Microsoft Word.
- Descriptivo: Las marcas dan información sobre su estructura y una descripción del contenido, como son XML y HTML.
Características comunes
- Texto plano: No permite almacenar información con formato (color, tipo de letra, tamaño, etc.). Están formados exclusivamente por caracteres (letras, caracteres especiales y de control). Ejemplos: Notepad o Gedit (Linux). Cada carácter ocupa 1 byte.
- Interoperabilidad: Se considera como formato universal, ya que puede abrirse y editarse desde cualquier máquina.
- Flexibles: Simplemente se necesita un editor de texto para crearlos y guardarlos en la extensión que se desee. Algunos se combinan con otros lenguajes para darle mayor funcionalidad.
XML: eXtensible Markup Language
El XML es un lenguaje abierto que sigue el estándar derivado de SGML y está optimizado para su uso en la World Wide Web. A diferencia de HTML, organiza el contenido de la presentación. Es un meta-lenguaje. No requiere conocimiento de programación para crear o modificar un documento sencillo. Permite intercambiar información entre distintos programas.
XML: Estructura y sintaxis
XML posee una estructura jerárquica en forma de árbol. Sus reglas principales son:
- Los elementos deben estar correctamente anidados.
- Los elementos no se pueden superponer entre ellos.
- Sólo puede haber un elemento raíz en el que estén contenidos todos los demás.
Los espacios de nombres (namespaces) son mecanismos que se usan para distinguir etiquetas que se denominan igual al emplear varios documentos XML, evitando de esta manera la ambigüedad.