Estadística Descriptiva Aplicada: Cálculo de Media y Dispersión en Datos Agrupados

Clasificado en Matemáticas

Escrito el en español con un tamaño de 7,42 KB

Ejercicio N.º 1: Razón Precio/Ganancia de Acciones

La razón precio/ganancia (P/G) de una emisión de acciones es la razón del precio por acción de la emisión más reciente sobre la ganancia por acción. Se dispone de 44 datos de esta índole. Suponga que $k = 8$ (número de clases).

Datos de la Razón Precio/Ganancia (n=44)

25.8	14.8	26.0	17.2	19.8	17.1	18.7
14.3	30.5	20.0	19.5	19.2	23.4	16.4
16.9	39.7	18.3	15.8	50.6	17.8	15.5
18.1	20.0	45.5	44.3	15.1	16.8	20.0
40.2	16.2	14.9	18.5	23.6	21.3	15.7
15.2	17.7	14.7	17.4	19.7	14.5	15.6
20.8	19.4

Objetivo: Calcular la Media ($\bar{x}$) y la Desviación Estándar ($s$) usando la Tabla de Frecuencias

Nota: Para facilitar los cálculos, los datos originales se multiplican por 10, convirtiendo el rango de [14.3, 50.6] a [143, 506]. Los resultados finales se dividirán por 10.

Cálculo de Parámetros de Agrupación

  • Dato Mayor (escalado): 506
  • Dato Menor (escalado): 143
  • Rango ($R$): $506 - 143 = 363$
  • Rango Muestral ($R_m$): $R + 1 = 363 + 1 = 364$
  • Número de Clases ($k$): 8
  • Ancho del Intervalo ($I$): $I = R_m / k = 364 / 8 = 45.5 \approx 46$
  • Exceso ($E$): $(I \cdot k) - R_m = (46 \cdot 8) - 364 = 4$
  • Límite Inferior de la Primera Clase ($L_i$): $L_i = \text{Dato menor} - E/2 - 0.5 = 143 - 4/2 - 0.5 = 140.5$

Tabla de Frecuencias (Datos Escalonados)

Clase$MC_i$ (Marca de Clase)Límites$n_i$ (Frecuencia Absoluta)$N_i$ (Frecuencia Acumulada)$F_i$ (Frecuencia Relativa Acumulada)$d_i$ (Desviación Codificada)$n_i d_i$$n_i d_i^2$
C1163.5140.5 - 186.523230.52000
C2209.5186.5 - 232.511340.7711111
C3255.5232.5 - 278.54380.862816
C4301.5278.5 - 324.51390.89339
C5347.5324.5 - 370.50390.89400
C6393.5370.5 - 416.52410.9351050
C7439.5416.5 - 462.52430.9861272
C8485.5462.5 - 508.51441.007749

Sumatorias: $\sum n_i = 44$ | $\sum n_i d_i = 51$ | $\sum n_i d_i^2 = 207$

Cálculo de la Media Aritmética ($\bar{x}$)

Fórmula (Método de Desviación Codificada):
$$\bar{x} = MC_0 + I \left(\frac{\sum n_i d_i}{n}\right)$$

Sustitución (Datos escalados):
$$\bar{x} = 163.5 + 46 \cdot \frac{51}{44} \approx 216.8$$

Media corregida (Datos originales):
$$\bar{x} = 216.8 / 10 = 21.68$$

Cálculo de la Varianza ($s^2$) y Desviación Estándar ($s$)

Fórmula de la Varianza (Método de Desviación Codificada):
$$s^2 = I^2 \left[ \frac{\sum n_i d_i^2}{n} - \left(\frac{\sum n_i d_i}{n}\right)^2 \right]$$

Sustitución (Datos escalados):
$$s^2 = 46^2 \left[ \frac{207}{44} - \left(\frac{51}{44}\right)^2 \right] \approx 7111.9$$

Desviación Estándar ($s$) (Datos escalados):
$$s = \sqrt{7111.9} \approx 84.3$$

Desviación Estándar corregida (Datos originales):
$$s = 84.3 / 10 = 8.43$$

Comparación de Dispersión mediante el Intervalo $\bar{x} \pm k s$

Se calcula el intervalo $\bar{x} \pm k s$ utilizando los datos escalados ($\bar{x} = 216.8$, $s = 84.3$) para $k=1, 2, 3$, y se compara el porcentaje de datos contenidos con la Regla Empírica (68%, 95%, 99.7%) y el Teorema de Chebyshev.

Valor de $k$Intervalo $\bar{x} \pm k s$Límites (Escalados)Número de Datos ContenidosPorcentaje ObservadoRegla Empírica (Normal)Teorema de Chebyshev (Mínimo)
$k=1$$216.8 \pm 84.3$132.5 - 301.138$38/44 \approx 86.4\%$$68\%$$0\%$
$k=2$$216.8 \pm 168.6$48.2 - 385.439$39/44 \approx 88.6\%$$95\%$$75\%$
$k=3$$216.8 \pm 252.9$-36.1 - 469.743$43/44 \approx 97.7\%$$99.7\%$$88.9\%$

Conclusión de la Dispersión:

Para $k=1$, el 86.4% de los datos se encuentran dentro de una desviación estándar de la media. Este porcentaje es significativamente mayor que el 68% esperado bajo una distribución normal, lo que indica que los datos están altamente agrupados alrededor de la media. Para $k=2$ y $k=3$, los porcentajes observados (88.6% y 97.7%) cumplen y superan los mínimos establecidos por el Teorema de Chebyshev (75% y 88.9%, respectivamente).


Ejercicio N.º 2: Edad Promedio de Comienzo del Consumo de Alcohol

Con el fin de tomar medidas adecuadas para combatir el alcoholismo, se realizó una encuesta en liceos de Santiago y algunas universidades. Los datos obtenidos representan la frecuencia acumulada de la edad de comienzo del consumo, considerando un ancho de intervalo $I = 4$ años.

Objetivo: Determinar la Edad Promedio de Comienzo en la Población Total de Consumidores

Se considera que el 61% de los consumidores encuestados eran hombres y el 39% eran mujeres.

Tabla de Frecuencias Relativas ($f_i$)

ClaseLímites de Edad (Años)$MC_i$ (Marca de Clase)$F_{iH}$ (Acumulada Hombres)$f_{iH}$ (Relativa Hombres)$F_{iM}$ (Acumulada Mujeres)$f_{iM}$ (Relativa Mujeres)
C14 - 860.230.230.370.37
C28 - 12100.740.510.410.04
C312 - 16140.900.160.860.45
C416 - 20180.940.040.910.05
C520 - 24221.000.061.000.09

Cálculo de la Edad Media por Género

La edad media se calcula como $\bar{x} = \sum (f_i \cdot MC_i)$.

  • Edad Media Hombres ($\bar{x}_H$):
    $$\bar{x}_H = 10.76 \text{ años}$$
  • Edad Media Mujeres ($\bar{x}_M$):
    $$\bar{x}_M = 11.80 \text{ años}$$

Cálculo de la Edad Promedio Ponderada ($\bar{x}$)

Se utiliza la media ponderada, donde $w_H = 0.61$ y $w_M = 0.39$.

Fórmula:
$$\bar{x} = w_H \cdot \bar{x}_H + w_M \cdot \bar{x}_M$$

Sustitución:
$$\bar{x} = 0.61 \cdot 10.76 + 0.39 \cdot 11.80 \approx 11.1656$$

Resultado: La edad promedio de comienzo en la población total de consumidores es de 11.17 años.

Entradas relacionadas: