Estadística Descriptiva: Medidas de Tendencia Central y Dispersión
Clasificado en Matemáticas
Escrito el en español con un tamaño de 4,27 KB
Conceptos Fundamentales de Estadística Descriptiva
Las medidas de tendencia central son herramientas estadísticas que permiten comprender el comportamiento global de un fenómeno estudiado. Entre las más importantes se encuentran la media aritmética, la mediana y la moda.
La Media Aritmética (Promedio)
La media aritmética, comúnmente conocida como promedio, se calcula sumando todos los valores de un conjunto de datos y dividiendo el resultado por el número total de datos.
Fórmula general:
Media (Ẋ) = (Σx) / n
Donde Σx
es la suma de todos los valores y n
es el número total de datos.
Ejemplo de cálculo:
Para los valores (18.2, 19.6, 20.4, 21.2, 22.1), si el número de datos es 5:
Ẋ = (18.2 + 19.6 + 20.4 + 21.2 + 22.1) / 5
Ẋ = 101.5 / 5
Ẋ = 20.3
Ventajas de la Media Aritmética
- Permite sintetizar los valores de una variable, ya que toma en cuenta todos los datos de la distribución.
- Siempre se puede calcular para variables cuantitativas.
- Es única; no existen dos medias aritméticas posibles para una misma distribución.
Desventajas de la Media Aritmética
A veces, su utilización puede dar lugar a conclusiones erróneas, especialmente cuando la variable presenta valores muy extremos (outliers). Estos valores influyen significativamente en la media, haciéndola poco representativa del conjunto de datos.
La Moda
La moda es el valor de la variable que más veces se repite en una distribución de datos; es decir, el que tiene asociada la mayor frecuencia absoluta.
La Mediana
La mediana es el valor de la variable que ocupa la posición central de la distribución una vez que los datos han sido ordenados. Es el valor que verifica que el 50% de las observaciones son mayores o iguales a él, y el otro 50% son menores o iguales.
Medidas de Dispersión
La Varianza
La varianza es una medida de dispersión que indica la mayor o menor variabilidad de los datos respecto de la media aritmética. Se calcula como la sumatoria de la distancia de cada dato respecto de la media, elevada al cuadrado, dividida por el número total de datos.
Indica la representatividad de la media como medida de tendencia central. Un valor de varianza bajo sugiere que los datos están agrupados cerca de la media, mientras que un valor alto indica una mayor dispersión.
Se utiliza el cuadrado de las desviaciones para asegurar que todas las diferencias sean positivas. Si no se elevara al cuadrado, las desviaciones positivas y negativas podrían compensarse entre sí, resultando en un valor cercano a cero, lo que erróneamente sugeriría una distribución homogénea.
La Desviación Típica (o Estándar)
La desviación típica (o desviación estándar) es la raíz cuadrada de la varianza. Es una medida de dispersión que se expresa en las mismas unidades que los datos originales, lo que facilita su interpretación.
Mide cuán esparcidos se encuentran los datos respecto de la media, o qué tan heterogéneos son entre sí. Es aplicable solo para variables cuantitativas.
Tipos de Distribuciones de Frecuencia
La forma de una distribución de frecuencia puede clasificarse según la relación entre sus medidas de tendencia central:
Distribución Simétrica
Es el caso ideal en que la Media (Ẋ) = Mediana (Me) = Moda (Mo). Los datos se distribuyen de manera uniforme alrededor del centro.
Distribución Asimétrica a la Izquierda (Asimetría Negativa)
En este tipo de distribución, la cola de la distribución se extiende hacia la izquierda. La relación entre las medidas de tendencia central es: Moda (Mo) ≥ Mediana (Me) ≥ Media (Ẋ).
Distribución Asimétrica a la Derecha (Asimetría Positiva)
En este caso, la cola de la distribución se extiende hacia la derecha. La relación entre las medidas de tendencia central es: Media (Ẋ) ≥ Mediana (Me) ≥ Moda (Mo).