Data Warehousing, Data Mining y Business Intelligence: Conceptos Clave

Clasificado en Informática

Escrito el en español con un tamaño de 4,5 KB

Data Warehousing, Data Mining y Business Intelligence

Data Warehousing: (cubos, datamart) - Estructuras multidimensionales que almacenan información calculada previamente de todas las combinaciones posibles.

Data Mining: Técnica para la extracción de patrones y reglas desde los datos, ayuda a crear nuevos modelos no percibidos por el analista hasta ese momento pero que realmente existen en los datos.

ETL - Extraer, transformar y cargar. Los datos de los sistemas OLAP son obtenidos desde los sistemas OLTP. Este no es un proceso trivial, existen cientos de potenciales problemas al momento de obtener los datos.

Ventajas de un Data Warehouse (DWH)

  • Confiable
  • Controlado
  • Única fuente de datos
  • No duplicación de esfuerzos
  • No conflictos en periodos de tiempo
  • No confusión de algoritmos
  • No restricciones de drill-down

Datamart: Es una base de datos departamental, especializada en el almacenamiento de los datos de un área de negocio específica. Dispone de una estructura óptima de datos para analizar la información al detalle desde todas las perspectivas que afecten a los procesos de dicho departamento.


Elementos que integran un Data Warehouse

Elementos: Metadata, API, Middleware, Mecanismos de Extracción, Mecanismos de Carga.

Middleware: Permite asegurar la conectividad entre los componentes de la arquitectura de un DW. Puede verse como capa API, en base a la cual los programadores pueden desarrollar aplicaciones que trabajen en diferentes ambientes sin preocuparse de los protocolos de red y comunicaciones en que correrán.

Tabla de Hechos: Es la tabla central de un esquema dimensional y contiene los valores de las medidas de negocio. Cada medida se toma mediante la intersección de las dimensiones que la definen.

Tipos de sistema OLAP: ROLAP, MOLAP - Procesamiento analítico multidimensional en línea. Diseñadas para realizar análisis de datos a través de.


Sistema de Información Ejecutiva (EIS)

Sistema de información ejecutiva EIS: Toma de decisiones en los niveles más altos de la gerencia. Convertir grandes cantidades de datos complejos en la información pertinente y proporcionarla a los gerencia en el nivel superior de forma oportuna. Ejemplo: El sector de productos de semiconductores de Motorola, ubicado en Austin, Texas, tenía cantidades masivas de datos almacenados, pero los gerentes no podía encontrar lo que necesitaban. La empresa implementó un EIS y obtuvieron fácil y rápidamente información acerca de las tendencias de compra de los clientes, manufactura, etc. (en computadoras y sin comandos complejos).

Características de una Base de Datos Operacional

  • Está orientada a la aplicación.
  • Tiene estructuras normalizadas.
  • Contiene los datos de las operaciones.
  • Los datos se almacenan con el máximo número de detalle.
  • Se actualiza en línea.
  • Está en constante cambio.

Sistema OLTP: Son los sistemas operacionales que capturan las transacciones de un negocio y las persisten en estructuras relacionales llamadas Base de Datos.

Características de un Sistema OLTP

Tiempo Real, Mantenimiento, Validar entrada, Capacidades Limitadas

¿Qué es una solución de Business Intelligence (BI)?

Recoger los datos de la organización y convertirlas en información útil.

Etapas de Construcción de un Data Warehouse

  1. Identificación de las necesidades y requerimientos. Reconocimiento (fuentes de datos originales y sus estructuras).
  2. En base a los requerimientos, definir las tablas auxiliares, procesos de selección, transformación e importación de datos.
  3. Construir el esquema multidimensional (requerimientos, tablas auxiliares).

Entradas relacionadas: