Fundamentos de Data Warehousing y Business Intelligence para la Toma de Decisiones

Clasificado en Magisterio

Escrito el en español con un tamaño de 6,08 KB

Data Warehouse: Conceptos Fundamentales

Un Data Warehouse, o almacén de datos, es un repositorio de datos diseñado para proporcionar una visión global, común e integrada de la información de una organización. Sus propiedades clave son:

  • Estable: Los datos no cambian una vez que se han cargado.
  • Coherente: La información es consistente a lo largo del tiempo y entre diferentes fuentes.
  • Fiable: Los datos son precisos y dignos de confianza.
  • Con información histórica: Permite el seguimiento de tendencias y el estudio a lo largo del tiempo.

Tipos de Métricas e Indicadores

En el contexto de la gestión de datos y la inteligencia de negocio, se distinguen varios tipos de métricas:

  1. Métricas de realización de actividad: Miden la ejecución de tareas o procesos.
  2. Métricas de resultado de una actividad: Cuantifican los logros o efectos de las actividades.
  3. Indicadores clave: Valores específicos que se deben alcanzar para lograr objetivos estratégicos. Dentro de estos, encontramos:
    • Indicadores Clave de Rendimiento (KPI - Key Performance Indicators): Métricas que miden el desempeño de una actividad o proceso.
    • Indicadores Clave de Meta (KGI - Key Goal Indicators): Métricas que miden el progreso hacia un objetivo estratégico.

El Proceso ETL y Bases de Datos Asociadas

El proceso ETL (Extract, Transform, Load) es fundamental para la construcción de un Data Warehouse:

  1. Extract (Extracción): Recopilación de datos de diversas fuentes, como:
    • Bases de datos (BBDD)
    • Ficheros de logs
    • Hojas de cálculo
    • Ficheros de texto
  2. Transform (Transformación): Aplicación de operaciones de limpieza, validación y homogeneización de los datos para asegurar su calidad y consistencia.
  3. Load (Carga): Introducción de los datos transformados en el Data Warehouse.

Bases de Datos para Data Warehousing

Los Data Warehouses pueden implementarse utilizando diferentes tipos de bases de datos:

  • Bases de Datos Relacionales: Estructuras tradicionales.
  • Bases de Datos Relacionales en Estrella (Star Schema): Un modelo optimizado para consultas de Data Warehousing.
  • Bases de Datos Multidimensionales: Diseñadas específicamente para el procesamiento analítico en línea.

OLAP: Procesamiento Analítico en Línea

OLAP (On-Line Analytical Processing) y las bases de datos multidimensionales están estrechamente ligados, ya que OLAP se implementa comúnmente con estas últimas, a menudo denominadas cubos OLAP.

Los cubos OLAP tienen tres componentes principales:

  1. Dimensiones: Categorías por las que se pueden estudiar los datos (ej., tiempo, producto, geografía).
  2. Métricas o Indicadores: Los valores numéricos que se están midiendo (ej., ventas, beneficios).
  3. Jerarquía de Dimensiones: Niveles de agregación dentro de una dimensión (ej., Año > Trimestre > Mes > Día).

Los cubos OLAP están asociados a tablas de hecho, que contienen las métricas y las claves a las dimensiones.

Business Intelligence (BI): De Datos a Conocimiento

La Business Intelligence (BI) es un conjunto de estrategias y herramientas enfocadas en la administración y creación de conocimiento a través del estudio de los datos de una organización. La información procesada se convierte en conocimiento, lo que facilita la toma de decisiones.

Una fórmula clave en BI es:

Decisión = Información + Riesgo

Según la definición de Julio, BI es: “Disponer de la información qué, cuándo, cómo, desde y dónde la necesitas para tomar decisiones.”

Tecnologías Clave en Business Intelligence

Dentro del ámbito de la BI, se integran diversas tecnologías:

  • Data Warehouse
  • Reporting (Generación de informes)
  • OLAP (On-Line Analytical Processing)
  • Cuadro de Mando y Cuadro de Mando Integral (Dashboards)
  • Minería de Datos (Data Mining)
  • Reglas del Negocio
  • Integración de Datos (ETL - Extract, Transform and Load)
  • Big Data

Herramientas y Monitorización en BI

Existen diversas herramientas que facilitan la implementación de la Business Intelligence, incluyendo aplicativos de Excel como Power Map y Power Query, que permiten explorar tecnologías como los GIS (Sistemas de Información Geográfica) y el OLAP.

Monitorización de Indicadores

La monitorización implica observar indicadores clave (KPIs) y pares de datos en tiempo real para evaluar el rendimiento y el progreso.

  1. Dashboard (Cuadro de Mando): Es una interfaz visual que presenta bloques de información útil y relevante para un departamento o área específica. Se actualizan periódicamente (diaria o semanalmente) para ofrecer una visión actualizada del rendimiento.
  2. Balanced Scorecard (Cuadro de Mando Integral): Una herramienta estratégica que ayuda a las organizaciones a traducir su visión y estrategia en un conjunto coherente de objetivos e indicadores. Incluye:
    • Líneas estratégicas
    • Indicadores (KPI)
    • Relaciones causa-efecto
    • Planes de acción

Finalmente, herramientas como Power BI Desktop permiten crear visualizaciones avanzadas para GIS y cuadros de mando en formato .pbix.

Entradas relacionadas: