OLAP y Data Mining: Análisis de Datos para la Toma de Decisiones

Clasificado en Informática

Escrito el en español con un tamaño de 3,91 KB

¿Qué significa OLAP?

OLAP (Online Analytical Processing) es una solución utilizada en el campo de la inteligencia empresarial cuyo objetivo es agilizar la consulta de grandes cantidades de datos.

Cubos OLAP

Un cubo OLAP es una base de datos multidimensional en la cual el almacenamiento físico de los datos se realiza en un vector multidimensional. Los cubos OLAP se pueden considerar como una ampliación de las dos dimensiones de una hoja de cálculo.

Tipos de cubos:

  1. ROLAP (Relational OLAP): El manejador es relacional y, a través de las herramientas de usuario final, se construyen los cubos. Es una solución menos costosa, pero dificulta la posibilidad de compartir la información multidimensional entre varios usuarios y puede obligar a una repetición de trabajo.
  2. MOLAP (Multidimensional OLAP): Su característica principal es contar con un manejador multidimensional que permite la creación directa y permanente de los cubos y aporta capacidades de administración y seguridad del ambiente equivalentes a las de un manejador relacional. Por otra parte, la existencia de un manejador multidimensional permite compartir, de manera natural, los cubos entre varios usuarios.
  3. HOLAP (Hybrid OLAP): Estos sistemas mantienen los registros detallados en la base de datos relacional, mientras que los datos resumidos o agregados se almacenan en una base de datos multidimensional separada.

Estrategias de consulta para los cubos OLAP:

  1. Segmentación: Se basa en colocarse en una dimensión del cubo, recorrerlo y "picarlo"; al picarlo se tendrá la cara del cubo para consultar.
  2. Filtrar: Sencillamente se trata de predecir en algunas de las caras del cubo un valor determinado.
  3. Drill Down: Se encarga de una consulta de lo macro a lo micro, a una expresión de una búsqueda esperada.
  4. Drill Up: Cuando se hace la consulta y se sube el nivel de granularidad (opuesto al Drill Down).
  5. Pivote: Se rota el cubo según la cara del cubo que se quiere ver.

Data Mining

Data Mining se refiere a una forma de análisis de información que encuentra patrones e irregularidades y descubre información no conocida. Las herramientas de Data Mining estudian la información almacenada en un Data Warehouse (DW) o en un ambiente multidimensional.

Métodos:

  1. Asociación: Consta de patrones entre conjuntos de datos masivos. Estas relaciones se enfocan en relaciones de hábitos y tendencias.
  2. Árboles de decisión: Sirven para entender o descubrir comportamientos secuenciales dentro de un conjunto de datos. De esta manera, se puede predecir comportamientos esquematizados.
  3. Modelos estadísticos: Están basados en funciones estadísticas especializadas donde la variable afectada permite hacer descubrimientos de patrones.
  4. Redes neuronales: Son uno de los casos más populares en estos tiempos. Su idea es simular el comportamiento neuronal ocurrido durante la sinapsis. El modo que tiene de emular este comportamiento es mediante la utilización de fórmulas matemáticas.
  5. Algoritmos genéticos: Se encarga de que dos algoritmos que compiten entre ellos, viendo cuál puede ser más apto.
  6. Regresión lineal: Tiene que ver con la estadística. Es el método más sencillo y rápido para encontrar relaciones entre dos variables.

Ejemplo:

El ayuntamiento de Zaragoza está participando en un proyecto de investigación, conjuntamente con la Universidad Pompeu Fabra de Barcelona, en el que se pretende desarrollar una herramienta que utilice técnicas de visualización de la información para los datos recolectados mediante un sistema de minería web.

Entradas relacionadas: