Estadística Descriptiva Aplicada: Cálculo de Media y Dispersión en Datos Agrupados
Clasificado en Matemáticas
Escrito el en
español con un tamaño de 7,42 KB
Ejercicio N.º 1: Razón Precio/Ganancia de Acciones
La razón precio/ganancia (P/G) de una emisión de acciones es la razón del precio por acción de la emisión más reciente sobre la ganancia por acción. Se dispone de 44 datos de esta índole. Suponga que $k = 8$ (número de clases).
Datos de la Razón Precio/Ganancia (n=44)
25.8 14.8 26.0 17.2 19.8 17.1 18.7 14.3 30.5 20.0 19.5 19.2 23.4 16.4 16.9 39.7 18.3 15.8 50.6 17.8 15.5 18.1 20.0 45.5 44.3 15.1 16.8 20.0 40.2 16.2 14.9 18.5 23.6 21.3 15.7 15.2 17.7 14.7 17.4 19.7 14.5 15.6 20.8 19.4
Objetivo: Calcular la Media ($\bar{x}$) y la Desviación Estándar ($s$) usando la Tabla de Frecuencias
Nota: Para facilitar los cálculos, los datos originales se multiplican por 10, convirtiendo el rango de [14.3, 50.6] a [143, 506]. Los resultados finales se dividirán por 10.
Cálculo de Parámetros de Agrupación
- Dato Mayor (escalado): 506
- Dato Menor (escalado): 143
- Rango ($R$): $506 - 143 = 363$
- Rango Muestral ($R_m$): $R + 1 = 363 + 1 = 364$
- Número de Clases ($k$): 8
- Ancho del Intervalo ($I$): $I = R_m / k = 364 / 8 = 45.5 \approx 46$
- Exceso ($E$): $(I \cdot k) - R_m = (46 \cdot 8) - 364 = 4$
- Límite Inferior de la Primera Clase ($L_i$): $L_i = \text{Dato menor} - E/2 - 0.5 = 143 - 4/2 - 0.5 = 140.5$
Tabla de Frecuencias (Datos Escalonados)
| Clase | $MC_i$ (Marca de Clase) | Límites | $n_i$ (Frecuencia Absoluta) | $N_i$ (Frecuencia Acumulada) | $F_i$ (Frecuencia Relativa Acumulada) | $d_i$ (Desviación Codificada) | $n_i d_i$ | $n_i d_i^2$ |
|---|---|---|---|---|---|---|---|---|
| C1 | 163.5 | 140.5 - 186.5 | 23 | 23 | 0.52 | 0 | 0 | 0 |
| C2 | 209.5 | 186.5 - 232.5 | 11 | 34 | 0.77 | 1 | 11 | 11 |
| C3 | 255.5 | 232.5 - 278.5 | 4 | 38 | 0.86 | 2 | 8 | 16 |
| C4 | 301.5 | 278.5 - 324.5 | 1 | 39 | 0.89 | 3 | 3 | 9 |
| C5 | 347.5 | 324.5 - 370.5 | 0 | 39 | 0.89 | 4 | 0 | 0 |
| C6 | 393.5 | 370.5 - 416.5 | 2 | 41 | 0.93 | 5 | 10 | 50 |
| C7 | 439.5 | 416.5 - 462.5 | 2 | 43 | 0.98 | 6 | 12 | 72 |
| C8 | 485.5 | 462.5 - 508.5 | 1 | 44 | 1.00 | 7 | 7 | 49 |
Sumatorias: $\sum n_i = 44$ | $\sum n_i d_i = 51$ | $\sum n_i d_i^2 = 207$
Cálculo de la Media Aritmética ($\bar{x}$)
Fórmula (Método de Desviación Codificada):
$$\bar{x} = MC_0 + I \left(\frac{\sum n_i d_i}{n}\right)$$
Sustitución (Datos escalados):
$$\bar{x} = 163.5 + 46 \cdot \frac{51}{44} \approx 216.8$$
Media corregida (Datos originales):
$$\bar{x} = 216.8 / 10 = 21.68$$
Cálculo de la Varianza ($s^2$) y Desviación Estándar ($s$)
Fórmula de la Varianza (Método de Desviación Codificada):
$$s^2 = I^2 \left[ \frac{\sum n_i d_i^2}{n} - \left(\frac{\sum n_i d_i}{n}\right)^2 \right]$$
Sustitución (Datos escalados):
$$s^2 = 46^2 \left[ \frac{207}{44} - \left(\frac{51}{44}\right)^2 \right] \approx 7111.9$$
Desviación Estándar ($s$) (Datos escalados):
$$s = \sqrt{7111.9} \approx 84.3$$
Desviación Estándar corregida (Datos originales):
$$s = 84.3 / 10 = 8.43$$
Comparación de Dispersión mediante el Intervalo $\bar{x} \pm k s$
Se calcula el intervalo $\bar{x} \pm k s$ utilizando los datos escalados ($\bar{x} = 216.8$, $s = 84.3$) para $k=1, 2, 3$, y se compara el porcentaje de datos contenidos con la Regla Empírica (68%, 95%, 99.7%) y el Teorema de Chebyshev.
| Valor de $k$ | Intervalo $\bar{x} \pm k s$ | Límites (Escalados) | Número de Datos Contenidos | Porcentaje Observado | Regla Empírica (Normal) | Teorema de Chebyshev (Mínimo) |
|---|---|---|---|---|---|---|
| $k=1$ | $216.8 \pm 84.3$ | 132.5 - 301.1 | 38 | $38/44 \approx 86.4\%$ | $68\%$ | $0\%$ |
| $k=2$ | $216.8 \pm 168.6$ | 48.2 - 385.4 | 39 | $39/44 \approx 88.6\%$ | $95\%$ | $75\%$ |
| $k=3$ | $216.8 \pm 252.9$ | -36.1 - 469.7 | 43 | $43/44 \approx 97.7\%$ | $99.7\%$ | $88.9\%$ |
Conclusión de la Dispersión:
Para $k=1$, el 86.4% de los datos se encuentran dentro de una desviación estándar de la media. Este porcentaje es significativamente mayor que el 68% esperado bajo una distribución normal, lo que indica que los datos están altamente agrupados alrededor de la media. Para $k=2$ y $k=3$, los porcentajes observados (88.6% y 97.7%) cumplen y superan los mínimos establecidos por el Teorema de Chebyshev (75% y 88.9%, respectivamente).
Ejercicio N.º 2: Edad Promedio de Comienzo del Consumo de Alcohol
Con el fin de tomar medidas adecuadas para combatir el alcoholismo, se realizó una encuesta en liceos de Santiago y algunas universidades. Los datos obtenidos representan la frecuencia acumulada de la edad de comienzo del consumo, considerando un ancho de intervalo $I = 4$ años.
Objetivo: Determinar la Edad Promedio de Comienzo en la Población Total de Consumidores
Se considera que el 61% de los consumidores encuestados eran hombres y el 39% eran mujeres.
Tabla de Frecuencias Relativas ($f_i$)
| Clase | Límites de Edad (Años) | $MC_i$ (Marca de Clase) | $F_{iH}$ (Acumulada Hombres) | $f_{iH}$ (Relativa Hombres) | $F_{iM}$ (Acumulada Mujeres) | $f_{iM}$ (Relativa Mujeres) |
|---|---|---|---|---|---|---|
| C1 | 4 - 8 | 6 | 0.23 | 0.23 | 0.37 | 0.37 |
| C2 | 8 - 12 | 10 | 0.74 | 0.51 | 0.41 | 0.04 |
| C3 | 12 - 16 | 14 | 0.90 | 0.16 | 0.86 | 0.45 |
| C4 | 16 - 20 | 18 | 0.94 | 0.04 | 0.91 | 0.05 |
| C5 | 20 - 24 | 22 | 1.00 | 0.06 | 1.00 | 0.09 |
Cálculo de la Edad Media por Género
La edad media se calcula como $\bar{x} = \sum (f_i \cdot MC_i)$.
- Edad Media Hombres ($\bar{x}_H$):
$$\bar{x}_H = 10.76 \text{ años}$$ - Edad Media Mujeres ($\bar{x}_M$):
$$\bar{x}_M = 11.80 \text{ años}$$
Cálculo de la Edad Promedio Ponderada ($\bar{x}$)
Se utiliza la media ponderada, donde $w_H = 0.61$ y $w_M = 0.39$.
Fórmula:
$$\bar{x} = w_H \cdot \bar{x}_H + w_M \cdot \bar{x}_M$$
Sustitución:
$$\bar{x} = 0.61 \cdot 10.76 + 0.39 \cdot 11.80 \approx 11.1656$$
Resultado: La edad promedio de comienzo en la población total de consumidores es de 11.17 años.