Conceptos Fundamentales de Estadística Descriptiva: Medidas, Dispersión y Correlación

Clasificado en Matemáticas

Escrito el en español con un tamaño de 3,42 KB

Mediana

La mediana es el valor de la variable tal que el número de observaciones menor que él es igual al número de observaciones mayor que él. La denotaremos por Me.

Parámetros de Dispersión

Se llama dispersión a las desviaciones que existen respecto de la media, es decir, es necesario saber en qué medida los datos numéricos están agrupados o no alrededor de los valores centrales. Los parámetros que realizan esto se denominan parámetros de dispersión. Existen tres parámetros de dispersión principales: rango, varianza y desviación típica.

Rango o Recorrido

El rango o recorrido es la diferencia entre el mayor valor y el menor valor que toma la variable estadística. Se denota por R.

Desviación

La desviación es la diferencia entre cada valor de la variable y la media.

Varianza

La varianza es la media aritmética de los cuadrados de las desviaciones respecto a la media. Se denota por V.

Desviación Típica

La desviación típica es la raíz cuadrada de la varianza, siempre es positiva. Se denota por σ (sigma).

Coeficiente de Variación

El coeficiente de variación es un parámetro que nos permite comparar dos poblaciones distintas. Se denota por CV.

Cuartiles, Percentiles y Deciles

Los cuartiles se obtienen al dividir una distribución en cuatro partes iguales. Si se divide en 100 partes, cada una recibiendo el 1%, obtendremos los centiles o percentiles. Si la dividimos en 10 partes, correspondiéndole un 10% a cada una, tendremos los deciles.

Distribución Bidimensional

Si tenemos un conjunto de n individuos y a cada uno de ellos se le toman dos medidas, es decir, se averigua qué valores toman en ellos dos variables (x e y), se obtiene así un conjunto de pares de puntos. Su representación adecuada es la nube de puntos.

Nube de Puntos o Diagrama de Dispersión

También llamada diagrama de dispersión. Sobre la nube se puede trazar una recta que se ajuste a ellos lo mejor posible. La recta se llama recta de regresión y pasa por un punto fundamental: el centro de gravedad de la distribución, formado por la media de x y la media de y. Hay dos tipos de rectas de regresión:

  • Y sobre x: se busca predecir y a partir de x.
  • X sobre y: se busca predecir x a partir de y.

Covarianza

La covarianza puede ser positiva o negativa. Si es positiva, la relación existente entre las variables será positiva. Si es negativa, la relación será negativa.

Coeficiente de Correlación o de Pearson

El coeficiente de correlación o de Pearson es un valor que nos va a permitir discutir la correlación entre las variables. Está comprendido entre -1 y 1. Cuando se acerca a 1, la correlación entre las variables es muy fuerte, buena y positiva. Cuando se acerca a -1, la relación es fuerte, buena y negativa. Cuando se acerca a 0, tanto por la derecha como por la izquierda, la correlación será débil y mala.

Entradas relacionadas: