Glosario de Términos Estadísticos: Análisis Exploratorio de Datos
Clasificado en Matemáticas
Escrito el en español con un tamaño de 4,15 KB
Exploratorio
Análisis Confirmatorio
Modo de análisis en el que se usan estadísticos a partir de un modelo previo sobre los datos para confirmar o rechazar una hipótesis.
Análisis Exploratorio
Modo interactivo e iterativo de análisis en el que tanto los estadísticos como los gráficos se usan para explorar datos sin una pauta predefinida.
Barras de Error
Representación gráfica de los valores de la media y del error típico de la media para grupos de casos.
Bisagras de Tukey
Medidas de la dispersión de una distribución similares a los cuartiles, cuyo valor se basa en el cálculo de la mediana de las medidas de localización precedentes.
Casos Atípicos (Outliers)
En una distribución, es cualquier observación que cae fuera del rango habitual de los casos, es decir, presenta valores claramente por encima o claramente por debajo de los demás casos y no es representativo de ningún grupo particular en la población.
Casos Extremos
Aquellas observaciones que presentan valores claramente por encima o por debajo de los demás casos. No todos los casos extremos tienen por qué ser casos atípicos (outliers).
Covariación
Variación conjunta de los valores de dos variables métricas.
Estimadores Robustos Centrales
Familia de medidas de tendencia central que se caracteriza por minimizar las funciones de desviación de las observaciones de la estimación.
Gráfico de Cajas y Bigotes
Resumen visual de la distribución de una variable métrica para diferentes categorías de otra variable no métrica.
Gráfico de Dispersión
Representación visual de la relación entre variables en las que cada caso se muestra como un punto en el espacio que genera el cruce de las puntuaciones en las variables. Es útil para examinar la dirección, la fuerza y, sobre todo, la forma de la relación.
Gráfico de Distribución Normal
Representación visual del ajuste de la distribución empírica a otra teórica que representa la normalidad de la distribución bien mediante las proporciones (P-P) o los cuantiles (Q-Q).
Gráfico de Doble Entrada
Representación visual que permite comparar las puntuaciones en dos variables métricas para grupos de casos definidos por otra variable categórica.
Gráfico de Máximos y Mínimos
Representación visual de la diferencia entre los valores de dos variables que son directamente comparables para grupos de casos definidos por otra variable.
Gráfico de Pareto
Representación visual de los valores de una variable para las categorías definidas por otra, que presenta una ordenación de las categorías además de los valores acumulados.
Gráfico de Perfiles
Representación visual de los perfiles multivariantes.
Gráfico de Tallo y Hojas
Representación visual de la distribución de los valores de una variable similar al histograma en el que cada caso está representado por uno o más dígitos que expresan su valor observado.
Histograma
Representación visual de la distribución de los valores de una variable métrica mediante barras que representan las frecuencias para grupos de valores desde el valor mínimo hasta el máximo.
Homoscedasticidad
Característica de las distribuciones conjuntas de frecuencias por la cual la varianza de una variable es similar a lo largo del rango de valores de la variable.
Linealidad
Rasgo propio de la covariación de dos o más variables métricas en función de la cual la nube de puntos que forman los casos en un gráfico de dispersión presenta una pauta similar a la de una línea recta.
Normalidad
Rasgo propio de las distribuciones de frecuencias que se aproximan a la forma de una curva de Gauss y que se caracterizan por su simetría y su mesocurtosis.
Perfil Multivariante
Conjunto de puntuaciones tipificadas de un grupo de casos en una serie de variables métricas.
Pruebas de Normalidad
Pruebas estadísticas que se utilizan para aceptar o rechazar la hipótesis nula de normalidad de la distribución.