Estimación de Proporción Salarial y Prueba de Hipótesis sobre Asistencia al Cine Post-Pandemia
Clasificado en Matemáticas
Escrito el en español con un tamaño de 7,45 KB
Estimación Puntual y por Intervalo (99%) para Asalariados con Estudios Superiores
Se busca estimar la proporción de asalariados con estudios superiores (Nivel de estudios 7) que tienen un salario mensual bruto de al menos 1000 euros.
Definición del Modelo
Sea X una variable aleatoria Bernoulli:
- X = 1: si el asalariado con estudios superiores tiene un salario bruto ≥ 1000 euros.
- X = 0: si el asalariado con estudios superiores tiene un salario bruto < 1000 euros.
El objetivo es estimar la proporción poblacional p de individuos con X=1.
Estimación Puntual
La estimación puntual de la proporción poblacional p es la proporción muestral:
&pcirc; = X̄ = 0.911111
Pivote y Distribución
Para construir el intervalo de confianza para una proporción con muestras grandes (n·p ≥ 5 y n·(1-p) ≥ 5, aproximado con &pcirc;), se utiliza el pivote basado en la aproximación Normal a la Binomial:
Z = (&pcirc; - p) / √(&pcirc;(1-&pcirc;)/n) ~ N(0, 1)
(Nota: A veces se usa p en el denominador, pero &pcirc; es común cuando p es desconocido).
Expresión del Intervalo de Confianza Aleatorio
El intervalo de confianza aleatorio al (1-α)% para p es:
IC1-α(p) = [ &pcirc; - zα/2 · √(&pcirc;(1-&pcirc;)/n) ; &pcirc; + zα/2 · √(&pcirc;(1-&pcirc;)/n) ]
Intervalo de Confianza Numérico (99%)
Con α = 0.01, zα/2 = z0.005 ≈ 2.576. Asumiendo n=45 (según la ruta de Statgraphics), el intervalo es:
IC99%(p) = [ 0.911111 - 2.576 · √(0.911111(1-0.911111)/45) ; 0.911111 + 2.576 · √(0.911111(1-0.911111)/45) ]
IC99%(p) = [ 0.911111 - 0.10959 ; 0.911111 + 0.10959 ]
IC99%(p) = [ 0.80152 ; 1.0207 ]
Nota: El intervalo proporcionado en el texto original [0.74574, 0.98466] puede provenir de un método diferente (ej. Clopper-Pearson exacto) o un tamaño muestral distinto. Usando el resultado del texto original:
IC99%(p) = [ 0.74574 ; 0.98466 ]
Interpretación del Resultado
Con un 99% de confianza, la proporción poblacional de asalariados con estudios superiores que cobran al menos 1000€ brutos mensuales se encuentra entre 0.74574 y 0.98466 (o entre 74.57% y 98.47%).
Ruta en Statgraphics
Para obtener la estimación puntual (&pcirc;):
Describir
→Análisis de una variable
→Resumen de análisis
- Datos: Salario mensual bruto ≥ 1000 (variable indicadora 0/1)
- Selección: Nivel de estudios = 7
- Resultado: La media de esta variable es la estimación &pcirc; = 0.91111.
Para obtener el intervalo de confianza:
Describir
→Pruebas de hipótesis
→Proporción Binomial
- Tamaño muestral (n): 45
- Proporción muestral (&pcirc;): 0.91111
- Alpha: 1% (para un nivel de confianza del 99%)
- Resultado: Intervalo de confianza numérico al 99%.
Estudio Comparativo de Asistencia al Cine Antes y Después de la Pandemia (2.5 puntos)
Se desea determinar si la asistencia media de público a las salas de cine ha cambiado después de la pandemia en comparación con antes. Se dispone de datos de espectadores de 2019 (antes) y 2022 (después) para una muestra de 22 salas de cine. Se asume normalidad en las diferencias y se ha obtenido un estadístico de contraste observado de 1.89.
Modelo, Hipótesis y Estadístico de Contraste
Modelo
- X1: Número de espectadores en 2019 (antes de la pandemia).
- X2: Número de espectadores en 2022 (después de la pandemia).
- D = X1 - X2: Diferencia en el número de espectadores para cada sala.
Se asume que las diferencias siguen una distribución Normal: D ~ N(μd, σd). Este es un caso de datos pareados.
Hipótesis
- Hipótesis Nula (H0): La asistencia media no ha cambiado, es decir, la diferencia media es cero. H0: μD = 0
- Hipótesis Alternativa (H1): La asistencia media ha cambiado (es diferente). H1: μD ≠ 0
Estadístico de Contraste
Bajo H0, el estadístico de contraste sigue una distribución t de Student con n-1 grados de libertad:
T* = (D̄ - μD0) / (Scd / √n) = (D̄ - 0) / (Scd / √22) ~ tn-1 = t21
Donde:
- D̄ es la media muestral de las diferencias.
- Scd es la desviación estándar muestral (cuasidesviación) de las diferencias.
- n = 22 es el tamaño de la muestra (número de pares).
Valor observado del estadístico: t*obs = 1.89
Región Crítica (Nivel de Significación α = 5%)
Para un contraste bilateral con α = 0.05 y 21 grados de libertad, la región crítica (RC) se define por los valores del estadístico que son suficientemente extremos para rechazar H0.
RC = { |t*| ≥ tα/2, n-1 } = { |t*| ≥ t0.025, 21 }
Consultando las tablas de la distribución t de Student o usando software, el valor crítico es:
t0.025, 21 ≈ 2.0796
Por lo tanto, la región crítica es:
RC = { |t*| ≥ 2.0796 } o, equivalentemente, RC = (-∞, -2.0796] ∪ [2.0796, +∞)
Como |t*obs| = |1.89| = 1.89, y 1.89 < 2.0796, el valor observado no cae en la región crítica.
Conclusión (al 5%): No hay evidencia estadística suficiente para rechazar H0. No podemos afirmar que la asistencia media haya cambiado.
Niveles de Significación para Rechazar H0
Se rechaza la hipótesis nula (H0) si el nivel de significación (α) elegido es mayor o igual que el p-valor del contraste.
El p-valor para un contraste bilateral es la probabilidad de obtener un valor del estadístico tan extremo o más que el observado, asumiendo que H0 es cierta:
p-valor = P(|t21| ≥ |t*obs|) = P(|t21| ≥ 1.89)
p-valor = P(t21 ≥ 1.89) + P(t21 ≤ -1.89) = 2 · P(t21 ≥ 1.89)
Usando software o tablas, se obtiene:
p-valor ≈ 0.07264
Conclusión: Se rechazaría la hipótesis nula (H0) para cualquier nivel de significación α ≥ 0.07264 (o 7.264%). Por ejemplo, se rechazaría H0 con α = 0.10, pero no con α = 0.05 (como vimos en el apartado b) o α = 0.01.