Glosario de Términos Estadísticos: Análisis Exploratorio de Datos

Clasificado en Matemáticas

Escrito el en español con un tamaño de 4,15 KB

Exploratorio

Análisis Confirmatorio

Modo de análisis en el que se usan estadísticos a partir de un modelo previo sobre los datos para confirmar o rechazar una hipótesis.

Análisis Exploratorio

Modo interactivo e iterativo de análisis en el que tanto los estadísticos como los gráficos se usan para explorar datos sin una pauta predefinida.

Barras de Error

Representación gráfica de los valores de la media y del error típico de la media para grupos de casos.

Bisagras de Tukey

Medidas de la dispersión de una distribución similares a los cuartiles, cuyo valor se basa en el cálculo de la mediana de las medidas de localización precedentes.

Casos Atípicos (Outliers)

En una distribución, es cualquier observación que cae fuera del rango habitual de los casos, es decir, presenta valores claramente por encima o claramente por debajo de los demás casos y no es representativo de ningún grupo particular en la población.

Casos Extremos

Aquellas observaciones que presentan valores claramente por encima o por debajo de los demás casos. No todos los casos extremos tienen por qué ser casos atípicos (outliers).

Covariación

Variación conjunta de los valores de dos variables métricas.

Estimadores Robustos Centrales

Familia de medidas de tendencia central que se caracteriza por minimizar las funciones de desviación de las observaciones de la estimación.

Gráfico de Cajas y Bigotes

Resumen visual de la distribución de una variable métrica para diferentes categorías de otra variable no métrica.

Gráfico de Dispersión

Representación visual de la relación entre variables en las que cada caso se muestra como un punto en el espacio que genera el cruce de las puntuaciones en las variables. Es útil para examinar la dirección, la fuerza y, sobre todo, la forma de la relación.

Gráfico de Distribución Normal

Representación visual del ajuste de la distribución empírica a otra teórica que representa la normalidad de la distribución bien mediante las proporciones (P-P) o los cuantiles (Q-Q).

Gráfico de Doble Entrada

Representación visual que permite comparar las puntuaciones en dos variables métricas para grupos de casos definidos por otra variable categórica.

Gráfico de Máximos y Mínimos

Representación visual de la diferencia entre los valores de dos variables que son directamente comparables para grupos de casos definidos por otra variable.

Gráfico de Pareto

Representación visual de los valores de una variable para las categorías definidas por otra, que presenta una ordenación de las categorías además de los valores acumulados.

Gráfico de Perfiles

Representación visual de los perfiles multivariantes.

Gráfico de Tallo y Hojas

Representación visual de la distribución de los valores de una variable similar al histograma en el que cada caso está representado por uno o más dígitos que expresan su valor observado.

Histograma

Representación visual de la distribución de los valores de una variable métrica mediante barras que representan las frecuencias para grupos de valores desde el valor mínimo hasta el máximo.

Homoscedasticidad

Característica de las distribuciones conjuntas de frecuencias por la cual la varianza de una variable es similar a lo largo del rango de valores de la variable.

Linealidad

Rasgo propio de la covariación de dos o más variables métricas en función de la cual la nube de puntos que forman los casos en un gráfico de dispersión presenta una pauta similar a la de una línea recta.

Normalidad

Rasgo propio de las distribuciones de frecuencias que se aproximan a la forma de una curva de Gauss y que se caracterizan por su simetría y su mesocurtosis.

Perfil Multivariante

Conjunto de puntuaciones tipificadas de un grupo de casos en una serie de variables métricas.

Pruebas de Normalidad

Pruebas estadísticas que se utilizan para aceptar o rechazar la hipótesis nula de normalidad de la distribución.

Entradas relacionadas: