Fundamentos de Data Warehousing y Business Intelligence para la Toma de Decisiones
Clasificado en Magisterio
Escrito el en español con un tamaño de 6,08 KB
Data Warehouse: Conceptos Fundamentales
Un Data Warehouse, o almacén de datos, es un repositorio de datos diseñado para proporcionar una visión global, común e integrada de la información de una organización. Sus propiedades clave son:
- Estable: Los datos no cambian una vez que se han cargado.
- Coherente: La información es consistente a lo largo del tiempo y entre diferentes fuentes.
- Fiable: Los datos son precisos y dignos de confianza.
- Con información histórica: Permite el seguimiento de tendencias y el estudio a lo largo del tiempo.
Tipos de Métricas e Indicadores
En el contexto de la gestión de datos y la inteligencia de negocio, se distinguen varios tipos de métricas:
- Métricas de realización de actividad: Miden la ejecución de tareas o procesos.
- Métricas de resultado de una actividad: Cuantifican los logros o efectos de las actividades.
- Indicadores clave: Valores específicos que se deben alcanzar para lograr objetivos estratégicos. Dentro de estos, encontramos:
- Indicadores Clave de Rendimiento (KPI - Key Performance Indicators): Métricas que miden el desempeño de una actividad o proceso.
- Indicadores Clave de Meta (KGI - Key Goal Indicators): Métricas que miden el progreso hacia un objetivo estratégico.
El Proceso ETL y Bases de Datos Asociadas
El proceso ETL (Extract, Transform, Load) es fundamental para la construcción de un Data Warehouse:
- Extract (Extracción): Recopilación de datos de diversas fuentes, como:
- Bases de datos (BBDD)
- Ficheros de logs
- Hojas de cálculo
- Ficheros de texto
- Transform (Transformación): Aplicación de operaciones de limpieza, validación y homogeneización de los datos para asegurar su calidad y consistencia.
- Load (Carga): Introducción de los datos transformados en el Data Warehouse.
Bases de Datos para Data Warehousing
Los Data Warehouses pueden implementarse utilizando diferentes tipos de bases de datos:
- Bases de Datos Relacionales: Estructuras tradicionales.
- Bases de Datos Relacionales en Estrella (Star Schema): Un modelo optimizado para consultas de Data Warehousing.
- Bases de Datos Multidimensionales: Diseñadas específicamente para el procesamiento analítico en línea.
OLAP: Procesamiento Analítico en Línea
OLAP (On-Line Analytical Processing) y las bases de datos multidimensionales están estrechamente ligados, ya que OLAP se implementa comúnmente con estas últimas, a menudo denominadas cubos OLAP.
Los cubos OLAP tienen tres componentes principales:
- Dimensiones: Categorías por las que se pueden estudiar los datos (ej., tiempo, producto, geografía).
- Métricas o Indicadores: Los valores numéricos que se están midiendo (ej., ventas, beneficios).
- Jerarquía de Dimensiones: Niveles de agregación dentro de una dimensión (ej., Año > Trimestre > Mes > Día).
Los cubos OLAP están asociados a tablas de hecho, que contienen las métricas y las claves a las dimensiones.
Business Intelligence (BI): De Datos a Conocimiento
La Business Intelligence (BI) es un conjunto de estrategias y herramientas enfocadas en la administración y creación de conocimiento a través del estudio de los datos de una organización. La información procesada se convierte en conocimiento, lo que facilita la toma de decisiones.
Una fórmula clave en BI es:
Decisión = Información + Riesgo
Según la definición de Julio, BI es: “Disponer de la información qué, cuándo, cómo, desde y dónde la necesitas para tomar decisiones.”
Tecnologías Clave en Business Intelligence
Dentro del ámbito de la BI, se integran diversas tecnologías:
- Data Warehouse
- Reporting (Generación de informes)
- OLAP (On-Line Analytical Processing)
- Cuadro de Mando y Cuadro de Mando Integral (Dashboards)
- Minería de Datos (Data Mining)
- Reglas del Negocio
- Integración de Datos (ETL - Extract, Transform and Load)
- Big Data
Herramientas y Monitorización en BI
Existen diversas herramientas que facilitan la implementación de la Business Intelligence, incluyendo aplicativos de Excel como Power Map y Power Query, que permiten explorar tecnologías como los GIS (Sistemas de Información Geográfica) y el OLAP.
Monitorización de Indicadores
La monitorización implica observar indicadores clave (KPIs) y pares de datos en tiempo real para evaluar el rendimiento y el progreso.
- Dashboard (Cuadro de Mando): Es una interfaz visual que presenta bloques de información útil y relevante para un departamento o área específica. Se actualizan periódicamente (diaria o semanalmente) para ofrecer una visión actualizada del rendimiento.
- Balanced Scorecard (Cuadro de Mando Integral): Una herramienta estratégica que ayuda a las organizaciones a traducir su visión y estrategia en un conjunto coherente de objetivos e indicadores. Incluye:
- Líneas estratégicas
- Indicadores (KPI)
- Relaciones causa-efecto
- Planes de acción
Finalmente, herramientas como Power BI Desktop permiten crear visualizaciones avanzadas para GIS y cuadros de mando en formato .pbix
.