Propiedades y Supuestos del Modelo Lineal: Residuos, R², RESET y Errores de Especificación

Escrito el 19 de Enero de 2026 en español con un tamaño de 5,7 KB

Propiedades descriptivas de los EMC

En este apartado se recogen las propiedades descriptivas fundamentales relativas a los residuos estimados de los estimadores por mínimos cuadrados ordinarios (MCO), y a la relación entre estimadores y variables explicativas.

La suma de los residuos de MCO es cero: Σ û_i = 0.
La media muestral de los residuos es cero: media(û) = 0.
La covarianza muestral entre los valores ajustados y los residuos de MCO es cero: Σ x_j û_j = 0.
El modelo estimado (hiperplano) pasa por los puntos medios de cada variable.

Forma general del modelo estimado:

y = β₀ + β₁x₁ + β₂x₂ + … + β_kx_k

Qué indican y qué no indican el R² y el R² corregido

El coeficiente de determinación R² y su versión corregida orientan sobre la capacidad explicativa del conjunto de regresores en la muestra utilizada.

Qué sí nos indican:

En qué medida los regresores incluidos explican la variabilidad de la variable dependiente en la muestra.

Qué no nos proporcionan:

Si una variable incluida es estadísticamente significativa o relevante para explicar la variable endógena (para eso se usan las pruebas t de Student).
Si hay variables omitidas o faltan variables en el modelo (para eso se utilizan pruebas como RESET u otras pruebas de especificación).

Supuestos clásicos del modelo lineal

Para poder realizar inferencia estadística es necesario conocer la distribución muestral de los estimadores. La validez de dicha distribución se determina bajo los supuestos clásicos del modelo lineal, habitualmente numerados como S1 a S6.

Supuestos (S1–S6):

S1. El modelo es lineal en los parámetros.
S2. Los datos se obtienen de una muestra aleatoria.
S3. La media condicional del término de error es nula: E[u | X] = 0.
S4. No existe colinealidad perfecta entre las variables independientes.
S5. Homocedasticidad: la varianza del término de error es constante, Var(u | X) = σ².
S6. El término de error poblacional u es independiente de las variables explicativas y sigue una distribución normal con media cero y varianza σ² (esto asegura la distribución normal de los estimadores bajo MCO).

El conjunto de estos supuestos (S1 a S6) son conocidos como los supuestos clásicos del modelo lineal. Bajo ellos, los estimadores por MCO son insesgados y, entre los lineales insesgados, tienen la menor varianza (propiedad de BLUE: Best Linear Unbiased Estimator) cuando se cumplen además S5 y S6 en la forma requerida.

RESET

La prueba RESET (Regression Specification Error Test) es una prueba general para detectar errores de especificación en la forma funcional del modelo.

Modelos para la prueba:

Modelo I (reduccido): y = β₀ + β₁x₁ + β₂x₂ + … + β_kx_k + u
Modelo II (expandido): y = β₀ + β₁x₁ + β₂x₂ + … + β_kx_k + S₁ŷ² + S₂ŷ³ + error

Hipótesis:

H₀: S₁ = S₂ = 0 (no hay error de especificación en la forma funcional).
H₁: al menos uno de S₁, S₂ es distinto de cero (rechazo de H₀ indica posible error de especificación).

Estadístico de prueba: Se utiliza un estadístico F con la forma F* aproximadamente distribuida como F_{q, n-(q+k+1)}, donde q es el número de restricciones (aquí 2) y n la muestra.

Decision: si F* > F_teórico ⇒ rechazar H₀ ⇒ existe evidencia de error por especificación de la forma funcional.

Errores de especificación del modelo: variables relevantes e irrelevantes

Los errores de especificación en cuanto a la inclusión o exclusión de variables pueden tener efectos distintos sobre los estimadores y sus varianzas.

Inclusión de variables irrelevantes (sobre-especificación):
- No tiene efectos sobre el sesgo de los estimadores: los estimadores siguen siendo insesgados.
- Tiene un efecto indeseado sobre las varianzas de los estimadores por MCO: las varianzas suelen ser más altas que en el modelo correctamente especificado.
Omisión de variables relevantes (sub-especificación):
- Genera estimadores sesgados (y, por tanto, inconsistentes en general si la variable omitida está correlacionada con regresores incluidos).
- Puede afectar también a la varianza de los estimadores por MCO (en algunos casos la varianza estimada resulta más baja que en el modelo correctamente especificado, lo que puede conducir a inferencias engañosas).

Notas finales

Las propiedades y pruebas aquí descritas son herramientas básicas para la especificación, estimación e inferencia en modelos de regresión lineal. Su correcta aplicación contribuye a obtener estimaciones fiables y a detectar problemas como sesgos, heterocedasticidad o especificación funcional incorrecta.

Entradas relacionadas:

Etiquetas:

R² errores de especificación varianza sesgo homocedasticidad regresión colinealidad MCO estimadores RESET supuestos modelo lineal residuos R² corregido