Bases de Datos Multidimensionales: Conceptos Clave y Arquitecturas OLAP

Clasificado en Informática

Escrito el en español con un tamaño de 4,43 KB

Conceptos Clave de las Bases de Datos Multidimensionales

Las bases de datos multidimensionales (BD multi) son bases de datos estructuradas basadas en dimensiones, optimizadas para consultas complejas y alto rendimiento en entornos de análisis de datos, como el Business Intelligence.

Definiciones Fundamentales

  • Dimensión: Criterio de clasificación de información. Representa un eje de análisis o una lista de valores que proporciona un índice a los datos (Ejemplos: Tiempo, Geografía, Producto).
  • Indicador: Valor numérico que se analiza a través de las dimensiones. Ejemplo: Ingreso = (Tiempo, Geografía, Producto).
  • Variable multidimensional: Indicador que contiene datos almacenados.
  • Fórmula multidimensional: Almacena una expresión para calcular los datos de un indicador.
  • Elementos de una dimensión: Los valores posibles de un eje de análisis.
  • Jerarquía: Forma de agrupar elementos de una dimensión con relaciones padre-hijo, permitiendo diferentes niveles de agregación.
  • Relaciones o atributos: Definen vínculos entre valores de dos dimensiones, donde un valor de una dimensión se relaciona con uno o más valores de otra.
  • Celda: Unidad mínima de almacenamiento, formada por la intersección de un valor de cada dimensión. Puede contener o no datos.

OLTP vs. OLAP

  • OLTP (Online Transaction Processing): Procesamiento de transacciones en línea. Se refiere a procesos clásicos de tratamiento automático de información (altas, bajas, consultas, modificaciones).
  • OLAP (Online Analytical Processing): Procesamiento analítico en línea. Sistemas orientados al acceso en modo consulta para análisis de información.

Operaciones OLAP Comunes

  • Rotación: Cambio de dimensiones en un informe para obtener diferentes perspectivas de los datos.
  • DrillDown: Descomponer visualmente un dato según una jerarquía de una dimensión, mostrando mayor detalle.
  • DrillUp: Agregar visualmente un dato según su jerarquía de dimensiones, mostrando un nivel superior de agregación.
  • RollUp: Proceso que calcula un indicador para una o más dimensiones, agregando los datos según las jerarquías definidas.
  • OLTP a OLAP: Proceso de migración de datos desde un sistema OLTP (transaccional) a uno OLAP (analítico).

Arquitecturas OLAP

  • R-OLAP (Relational OLAP): Los datos se almacenan en una base de datos relacional, utilizando un esquema en estrella o copo de nieve.
  • M-OLAP (Multidimensional OLAP): Los datos se almacenan en una base de datos multidimensional nativa, optimizada para un acceso más rápido, pero con mayores requisitos de almacenamiento.
  • H-OLAP (Hybrid OLAP): Combina tecnologías ROLAP y MOLAP. El motor de base de datos, vistas, etc., pueden utilizar características de ambas arquitecturas.

Modelado Multidimensional

El modelado multidimensional se centra en la creación de estructuras de datos optimizadas para el análisis. Se define principalmente por dos elementos:

  • Tablas del Data Warehouse:
    • Tabla de Hechos (Fact Table): Almacena los registros históricos del modelo relacional, conteniendo las medidas numéricas (indicadores) y las claves foráneas que referencian a las dimensiones.
    • Tablas de Dimensiones (Lookup Tables/Dimension Tables): Contienen el detalle descriptivo de los valores asociados a la tabla de hechos.
  • Esquema del Data Warehouse:
    • Esquema en Estrella: Una tabla de hechos central rodeada por tablas de dimensiones. La tabla de hechos contiene claves foráneas que apuntan a las claves primarias de las tablas de dimensiones.
    • Esquema en Copo de Nieve: Similar al esquema en estrella, pero las tablas de dimensiones están normalizadas, lo que puede generar jerarquías más complejas. Cada tabla de dimensión contiene solo el nivel que es clave primaria en la tabla y la clave foránea de su relación con el nivel superior más cercano.

Entradas relacionadas: