Repositorio Digital: Metadatos, Interoperabilidad y Estándares

Clasificado en Informática

Escrito el en español con un tamaño de 6,04 KB

Repositorios Digitales (REP)

Un repositorio digital (REP) es un medio para obtener, gestionar, almacenar y proporcionar acceso a contenido digital. Puede adoptar diversas formas, como sitios web o bases de datos. La forma en que se diferencia el contenido depende de los usuarios a los que se dirige.

Características (CAR):

  • Uso de metadatos para describir el contenido.
  • Utilización de estándares, preferiblemente abiertos, para asegurar la interoperabilidad.
  • Ofrecimiento de servicios adicionales, como la búsqueda o la navegación por el contenido.

El tipo de contenido influye en la forma en que se gestiona y se accede a él.

Exportación (EXPORT)

El protocolo OAI-PMH es un estándar que permite a sistemas remotos obtener el contenido de un repositorio. Otros métodos de exportación incluyen RSS y herramientas de exportación personalizadas.

Integración (INTEGRAC)

Los sistemas externos pueden obtener elementos de un repositorio a través de la exportación (como OAI-PMH o RSS) o mediante APIs que proporcionan servicios al repositorio, como búsqueda, autenticación, escaneo de virus o validación de datos.

Requerimientos (REQUER)

  • Acceso abierto al contenido.
  • Motor de búsqueda con capacidad de indexación.
  • Metadatos bibliográficos completos.
  • Funcionalidad de exportación e importación de datos.
  • Capacidad de obtener metadatos de otros sistemas.
  • Sistema de identificación persistente para los recursos.

Beneficios de las Librerías (LIB)

Las librerías digitales dan acceso a repositorios grandes y organizados, permiten reorganizar la información y enriquecerla, creando colecciones temáticas.

Metadatos (META)

Tipos de Metadatos

  • Descriptivos: Facilitan el descubrimiento y la identificación del contenido. Ejemplos: título, autor, palabras clave.
  • Estructurales: Describen cómo un elemento se relaciona con otro. Permiten almacenar diferentes versiones de un mismo recurso.
  • Administrativos: Facilitan la gestión del contenido. Ejemplos: licencia, formato, fecha de creación.

Esquemas de Metadatos (Schema data)

Un esquema de metadatos es un conjunto de metadatos agrupados en sets para un propósito específico. Describe los elementos de metadatos y cómo se relacionan entre ellos.

Perfiles de Aplicación (App profile)

Un perfil de aplicación describe el uso de los metadatos declarados en un esquema de metadatos. Va más allá del esquema, añadiendo reglas de negocio y de uso de los metadatos.

Estándares de Metadatos

  • Dublin Core (DC): Un set de 15 elementos genéricos para definir recursos en un formato legible por máquinas. Es un estándar mínimo para la Open Archives Initiative (OAI-PMH) y es utilizado por muchas bibliotecas. Se puede usar como elemento central en otros esquemas o para conmutar vocabularios para esquemas más complejos.
  • Qualified Dublin Core (QDC): Una extensión de Dublin Core que proporciona mayor expresividad y permite extender sus usos. Ofrece nuevas capacidades, refinamiento de elementos y sistemas de codificación.
  • OAI-ORE: Permite representar grupos de objetos digitales.
  • MARC: MARC (MAchine-Readable Cataloging) fue uno de los primeros estándares de metadatos legibles por máquina. MARC XML es su versión en formato XML.
  • PREMIS: Estándar para la preservación de objetos digitales.

Open Archives Initiative - Protocol for Metadata Harvesting (OAI-PMH)

OAI-PMH es un protocolo/interfaz común para obtener metadatos de los repositorios digitales. Promueve el uso de estándares de interoperabilidad para facilitar la difusión eficiente de los contenidos. Es la interfaz más utilizada para la recolección de metadatos (harvesting).

Crawling vs Harvesting

  • Crawling: Proceso usado por servicios externos como Google, que siguen enlaces de sitios web para indexar su contenido textual. No pueden usar metadatos estructurales.
  • Harvesting: Realización de consultas al repositorio sobre su contenido, que devuelven una lista de elementos con metadatos asociados. OAI-PMH es la interfaz de harvesting más usada.

Data Provider y Service Provider

  • Data Provider: Sitio que almacena materiales y los proporciona cuando es necesario a través de OAI-PMH.
  • Service Provider: Usa los datos de los Data Providers para satisfacer las necesidades de los usuarios, como buscar y acceder a la información.

Componentes de OAI-PMH

  • Peticiones: Enviadas como GET y POST. Los repositorios deben soportar ambos métodos.
  • Respuestas: Tienen el formato de las respuestas HTTP. El formato tiene que ser XML con un marcado específico de OAI-PMH.

Verbos de OAI-PMH

  • Identify: Devuelve información sobre el repositorio.
  • ListSets: Lista los sets de metadatos que contiene el repositorio.
  • ListMetadataFormats: Lista los formatos de metadatos soportados por el repositorio.
  • ListIdentifiers: Lista los identificadores de los recursos del repositorio.
  • ListRecords: Recolecta los metadatos de los recursos del repositorio.
  • GetRecord: Obtiene un registro individual del repositorio.

Registrar un Repositorio en OAI-PMH

Registrar un repositorio en un registro de OAI-PMH lo hace visible para otros administradores de repositorios, aumenta la visibilidad del contenido y permite el uso de estadísticas que proporcionan los registros. Los datos pueden ser usados por sitios que usan datos de repositorios OAI-PMH.

Entradas relacionadas: