Análisis Exploratorio de Datos

Clasificado en Diseño e Ingeniería

Escrito el en español con un tamaño de 2,37 KB

Las técnicas del análisis exploratorio de datos permiten analizar la información exhaustivamente y detectar las posibles anomalías que presentan las observaciones. Los estadísticos descriptivos más usados son la media y la desviación típica. Los mismos son convenientes sólo cuando la distribución de datos es aproximadamente normal o, al menos, simétrica y unimodal. Por lo tanto, cuando no se presenta esta situación es necesario un examen a fondo de la estructura de los datos. Se recomienda iniciar un análisis de exploración visual (gráficos) y para la exploración formal el uso de estadísticos robustos (aquellos que se ven poco afectados por valores atípicos). Fruto del análisis exploratorio, a veces es necesario realizar transformación de variables.

Análisis de Datos Cuantitativos

Para datos cuantitativos es aconsejable comenzar con el gráfico de tallo y hojas o histograma digital. El paso siguiente suele ser examinar la posible presencia de normalidad, simetría y valores atípicos (outliers) en el conjunto de datos. Para ello suelen utilizarse los gráficos de caja y bigote. No obstante, los gráficos de caja siempre deben ir acompañados de los histogramas digitales (o gráficos de tallo y hojas), ya que los primeros no detectan la presencia de distribuciones multimodales. Los gráficos de dispersión nos dan una idea de las relaciones entre variables y su ajuste.

Análisis de Datos Cualitativos

La exploración visual de variables cualitativas suele llevarse a cabo mediante diagramas de rectángulos, diagramas de sectores y pictogramas. Los diagramas de rectángulos se construyen asignando a cada modalidad de la variable cualitativa un rectángulo con altura igual (o proporcional) a su frecuencia absoluta con base constante.

Importancia del Análisis Exploratorio

En síntesis, es muy importante comprender los datos, pues esta fase es determinante en lo que las fases sucesivas sean capaces de extraer y sea conocimiento válido y útil a partir de la información original. Así como determinar si los datos con los que se cuenta son suficientes, si son realmente útiles, porque algunas veces no resulta obvio que los datos con que se cuenta no pueden proveer la respuesta buscada. Por ello la importancia de prestar atención a esta etapa.

Entradas relacionadas: