Fundamentos de Inferencia Estadística en Modelos de Regresión: Supuestos y Aplicaciones
Clasificado en Matemáticas
Escrito el en español con un tamaño de 4,49 KB
Introducción a la Inferencia Estadística y Supuestos del Modelo
El concepto de SCR (Suma de Cuadrados de los Residuos) se refiere a la suma de todos los errores que se cometen en los datos de la muestra. Es una medida fundamental en la evaluación de la bondad de ajuste de un modelo.
Inferencia Estadística: Conceptos Clave
Las pruebas de hipótesis y los intervalos de confianza son herramientas esenciales en la inferencia estadística. ¿Para qué sirven? Su propósito principal es validar, desde el punto de vista estadístico, que los coeficientes (como alfa y beta) sean efectivamente los parámetros que permiten explicar la variable dependiente (Y) en el modelo. La validación se realiza a través de estas pruebas de hipótesis y la construcción de intervalos de confianza, que actúan como un complemento.
Supuestos Fundamentales para la Inferencia
Para llevar a cabo un test de hipótesis de manera válida, es fundamental considerar las siguientes propiedades. Todas las pruebas de hipótesis y los intervalos de confianza que se construyen se basan en que el error teórico posee ciertas características que deben cumplirse, ya que, si no se cumplen, el modelo está sesgado.
Características del Error (i.i.d. y Normalidad)
El error debe ser independiente e idénticamente distribuido (i.i.d.). Esto significa que cada error de la muestra (desde la observación 1 hasta 'n', donde 'n' es el tamaño de la muestra) es independiente de los demás y sigue la misma distribución de probabilidad. Específicamente, esa distribución de probabilidad es una distribución normal (gaussiana) que tiene una media de 0 y una varianza constante (homocedasticidad).
Resumen de los Supuestos Clave para MCO
En resumen, para que la estimación por Mínimos Cuadrados Ordinarios (MCO) sea óptima y los resultados de la inferencia sean válidos, se requieren las siguientes propiedades del error:
- Distribución Normal
- El primer momento (media) es cero.
- El segundo momento (varianza) es sigma al cuadrado (σ²), es decir, constante.
- No hay correlación entre los errores (ausencia de autocorrelación).
- No hay correlación entre el error y la variable independiente (exogeneidad estricta).
Aplicación de la Inferencia: Intervalos de Confianza y Pruebas de Hipótesis
Intervalo de Confianza para los Coeficientes (β̂)
¿Cómo determinamos el intervalo de confianza para un coeficiente estimado (β̂)? Se calcula utilizando la siguiente fórmula:
β̂ ± t_(1-α/2; n-2) * SE(β̂)
Donde:
- β̂ es el coeficiente estimado.
- t_(1-α/2; n-2) es el valor crítico de la distribución t-Student para un nivel de significancia (α) dado y n-2 grados de libertad. Este valor se obtiene de la tabla de distribución t-Student.
- α (alfa) representa el nivel de significancia o el error permitido. Por ejemplo, si trabajamos con un 95% de nivel de confianza, existe un 5% (0.05) considerado como error.
- n-2 son los grados de libertad. Se restan 2 porque en el modelo de regresión simple se estiman dos parámetros muestrales (el intercepto α y la pendiente β). Si se conocieran los parámetros poblacionales, no sería necesario restar 2.
- SE(β̂) es el error estándar del coeficiente estimado, que se calcula como
S / √[Σ(xᵢ - x̄)²]
, donde S es la desviación estándar de los residuos.
Prueba de Hipótesis
La prueba de hipótesis es el otro pilar de la inferencia estadística.
Hipótesis Nula (H₀)
La Hipótesis Nula (H₀) es una afirmación que se asume como verdadera hasta que la evidencia estadística demuestre lo contrario. Generalmente, en regresión, se plantea que un coeficiente es igual a cero (es decir, no tiene efecto).
Nota: Para una comprensión más profunda de las pruebas de hipótesis, se recomienda revisar los últimos 30 minutos del audio de referencia.