Propiedades y Supuestos del Modelo Lineal: Residuos, R², RESET y Errores de Especificación
Clasificado en Matemáticas
Escrito el en
español con un tamaño de 5,7 KB
Propiedades descriptivas de los EMC
En este apartado se recogen las propiedades descriptivas fundamentales relativas a los residuos estimados de los estimadores por mínimos cuadrados ordinarios (MCO), y a la relación entre estimadores y variables explicativas.
- La suma de los residuos de MCO es cero: Σ ûi = 0.
- La media muestral de los residuos es cero: media(û) = 0.
- La covarianza muestral entre los valores ajustados y los residuos de MCO es cero: Σ xj ûj = 0.
- El modelo estimado (hiperplano) pasa por los puntos medios de cada variable.
Forma general del modelo estimado:
y = β0 + β1x1 + β2x2 + … + βkxk
Qué indican y qué no indican el R2 y el R2 corregido
El coeficiente de determinación R2 y su versión corregida orientan sobre la capacidad explicativa del conjunto de regresores en la muestra utilizada.
Qué sí nos indican:
- En qué medida los regresores incluidos explican la variabilidad de la variable dependiente en la muestra.
Qué no nos proporcionan:
- Si una variable incluida es estadísticamente significativa o relevante para explicar la variable endógena (para eso se usan las pruebas t de Student).
- Si hay variables omitidas o faltan variables en el modelo (para eso se utilizan pruebas como RESET u otras pruebas de especificación).
Supuestos clásicos del modelo lineal
Para poder realizar inferencia estadística es necesario conocer la distribución muestral de los estimadores. La validez de dicha distribución se determina bajo los supuestos clásicos del modelo lineal, habitualmente numerados como S1 a S6.
Supuestos (S1–S6):
- S1. El modelo es lineal en los parámetros.
- S2. Los datos se obtienen de una muestra aleatoria.
- S3. La media condicional del término de error es nula: E[u | X] = 0.
- S4. No existe colinealidad perfecta entre las variables independientes.
- S5. Homocedasticidad: la varianza del término de error es constante, Var(u | X) = σ2.
- S6. El término de error poblacional u es independiente de las variables explicativas y sigue una distribución normal con media cero y varianza σ2 (esto asegura la distribución normal de los estimadores bajo MCO).
El conjunto de estos supuestos (S1 a S6) son conocidos como los supuestos clásicos del modelo lineal. Bajo ellos, los estimadores por MCO son insesgados y, entre los lineales insesgados, tienen la menor varianza (propiedad de BLUE: Best Linear Unbiased Estimator) cuando se cumplen además S5 y S6 en la forma requerida.
RESET
La prueba RESET (Regression Specification Error Test) es una prueba general para detectar errores de especificación en la forma funcional del modelo.
Modelos para la prueba:
- Modelo I (reduccido): y = β0 + β1x1 + β2x2 + … + βkxk + u
- Modelo II (expandido): y = β0 + β1x1 + β2x2 + … + βkxk + S1ŷ2 + S2ŷ3 + error
Hipótesis:
- H0: S1 = S2 = 0 (no hay error de especificación en la forma funcional).
- H1: al menos uno de S1, S2 es distinto de cero (rechazo de H0 indica posible error de especificación).
Estadístico de prueba: Se utiliza un estadístico F con la forma F* aproximadamente distribuida como Fq, n-(q+k+1), donde q es el número de restricciones (aquí 2) y n la muestra.
Decision: si F* > Fteórico ⇒ rechazar H0 ⇒ existe evidencia de error por especificación de la forma funcional.
Errores de especificación del modelo: variables relevantes e irrelevantes
Los errores de especificación en cuanto a la inclusión o exclusión de variables pueden tener efectos distintos sobre los estimadores y sus varianzas.
- Inclusión de variables irrelevantes (sobre-especificación):
- No tiene efectos sobre el sesgo de los estimadores: los estimadores siguen siendo insesgados.
- Tiene un efecto indeseado sobre las varianzas de los estimadores por MCO: las varianzas suelen ser más altas que en el modelo correctamente especificado.
- Omisión de variables relevantes (sub-especificación):
- Genera estimadores sesgados (y, por tanto, inconsistentes en general si la variable omitida está correlacionada con regresores incluidos).
- Puede afectar también a la varianza de los estimadores por MCO (en algunos casos la varianza estimada resulta más baja que en el modelo correctamente especificado, lo que puede conducir a inferencias engañosas).
Notas finales
Las propiedades y pruebas aquí descritas son herramientas básicas para la especificación, estimación e inferencia en modelos de regresión lineal. Su correcta aplicación contribuye a obtener estimaciones fiables y a detectar problemas como sesgos, heterocedasticidad o especificación funcional incorrecta.