Conceptos Fundamentales de Regresión Lineal y Econometría
Clasificado en Matemáticas
Escrito el en
español con un tamaño de 4,86 KB
Pruebas de Hipótesis y Colas
¿Cuándo se utiliza una cola y cuándo dos en las pruebas de hipótesis?
- Se utiliza una cola (prueba unilateral) para determinar una regla para rechazar $H_0$ en hipótesis direccionales (ej. $\beta_1 > 0$ o $\beta_1 < 0$).
- Se utilizan dos colas (prueba bilateral) para contrastar hipótesis de igualdad o diferencia (ej. $\beta_1 = 0$ o $\beta_1 \neq 0$).
Medidas de Bondad de Ajuste
Coeficiente de Determinación ($R^2$)
El $R^2$ (R cuadrado) es el cociente entre la variación explicada y la variación total. Una propiedad importante es que nunca decrece; solo aumenta cuando se añaden nuevas variables explicativas al modelo, independientemente de su significancia estadística.
Supuestos Clásicos del Modelo de Regresión Lineal (MCRL)
Varianza de las Perturbaciones
- Heterocedasticidad
- Es frecuente en series de corte transversal. Ocurre cuando la varianza de las perturbaciones (o errores) no es constante a lo largo de las observaciones. Esto viola el supuesto de homocedasticidad del MCRL.
- Homocedasticidad
- Ocurre cuando la varianza del término de error, condicional a las variables explicativas, es constante a lo largo de todas las observaciones. Este es un supuesto fundamental del MCRL.
Fundamentos de la Regresión
Factores No Observables (Término de Error $u$)
Los factores no observables se agrupan en el término de error ($u$). Este componente es crucial en la regresión, ya que captura la influencia de todas las variables omitidas o no medidas que afectan a la variable dependiente, pero que no están explícitamente incluidas en el modelo.
Funciones de Regresión (FRP vs. FRM)
La diferencia fundamental entre la Función de Regresión Poblacional (FRP) y la Función de Regresión Muestral (FRM) es:
- La FRP (Population Regression Function) es la relación verdadera, es fija y generalmente desconocida.
- La FRM (Sample Regression Function) es la estimación de la FRP, determinada a partir de los datos muestrales disponibles.
Propiedades de las Desviaciones
El hecho de que la sumatoria de las desviaciones respecto a la media sea cero ($\sum (x_i - \bar{x}) = 0$) se debe a que la media es el centro de gravedad de la distribución. Los valores negativos y positivos se anulan mutuamente. Esta es una propiedad fundamental de la media aritmética.
Problemas y Precauciones en la Modelización
Limitaciones del Coeficiente de Determinación ($R^2$)
No es recomendable confiar únicamente en el $R^2$ para verificar la fiabilidad de un modelo. Esto se debe a su formulación: cada vez que se añade una nueva variable explicativa al modelo, el $R^2$ aumentará (o se mantendrá igual), sin importar si dicha variable tiene incidencia estadística real o no. Por lo tanto, aunque es un indicador de bondad de ajuste, no es un indicador fiable de la calidad predictiva o la parsimonia del modelo.
Regresión a Través del Origen y Sobre-especificación
Regresión a Través del Origen (RTO)
Si se fuerza una regresión a través del origen (asumiendo $\beta_0 = 0$) cuando en realidad el intercepto poblacional es distinto de cero, se pueden producir varios problemas:
- Sesgo en los estimadores de los coeficientes.
- El $R^2$ puede resultar negativo.
- La suma de los residuos será distinta de cero.
Problemas de la Sobre-especificación
La sobre-especificación (incluir variables irrelevantes) no introduce problemas de sesgo en los estimadores de Mínimos Cuadrados Ordinarios (MCO), pero sí aumenta la varianza de los estimadores, haciéndolos menos precisos.
El Supuesto Ceteris Paribus
Cuando se interpreta un coeficiente de regresión bajo la condición ceteris paribus (manteniendo el resto de factores constantes), se está invocando el supuesto de media condicional cero (RLM.4 en regresión múltiple o RLS.4 en regresión simple). Este supuesto es crucial para garantizar que los estimadores MCO sean insesgados.
Estimación
Mejor Estimador de la Esperanza
El promedio muestral (o media muestral) es considerado el mejor estimador de la esperanza poblacional (media poblacional) bajo ciertas condiciones, ya que es un estimador insesgado y, a menudo, eficiente (Mínima Varianza Insesgada, si se cumplen los supuestos).