Regresión Múltiple: Conceptos Esenciales, Interpretación y Pruebas de Hipótesis

Clasificado en Matemáticas

Escrito el en español con un tamaño de 2,79 KB

Modelo de Regresión Múltiple: Fundamentos y Características

El modelo de regresión múltiple se representa comúnmente con la siguiente ecuación:

Y = β₀ + β₁X₁ + β₂X₂ + μ

Interpretación y Supuestos Clave

  • La interpretación de la Función de Regresión Poblacional (FRP) estocástica es la misma que en el modelo de **regresión simple**.
  • Se mantienen los mismos **supuestos del modelo clásico de regresión**.
  • Como ahora hay más de una variable explicativa, se enfatiza el supuesto de **no perfecta colinealidad** de las variables explicativas X₁ y X₂.
  • Si existiera perfecta asociación lineal entre las variables, entonces los **parámetros no podrían estimarse por separado**.

Significado de los Coeficientes de Regresión

Se conocen como los **coeficientes de regresión parcial** y miden el cambio en el valor de la media de Y, E(Y), por unidad de cambio en X, **manteniendo constantes** el resto de variables explicativas.

Es equivalente al concepto de **derivada parcial**.

Los **parámetros poblacionales** se estiman con **Mínimos Cuadrados Ordinarios (MCO)**, mediante la minimización de la suma de los errores estimados al cuadrado.

Coeficiente de Determinación y Pruebas de Hipótesis

  • El **coeficiente de determinación (R²)** se calcula de la misma forma que en un modelo de regresión simple y su interpretación no cambia.
  • Por otro lado, si se agregan variables explicativas a un modelo de regresión, esto lleva per se a que disminuya la sumatoria de errores estimados al cuadrado, aumentando el coeficiente de determinación.
  • Para corregir ese problema, se construye el **R² ajustado**.
  • Al comparar dos modelos con base en el coeficiente de determinación, ajustado o no, el **tamaño de la muestra (n)** y la **variable dependiente** deben ser los mismos; las variables explicativas pueden tomar cualquier forma.
  • Se mantiene el **supuesto de normalidad** de los errores poblacionales, como en el modelo de regresión simple.
  • Dado que se desconoce la **varianza poblacional** y solo es posible tener una estimación de ella, se trabaja con la **distribución t**.
  • En el caso de la **regresión múltiple**, es posible realizar un conjunto de **pruebas de hipótesis**, para lo cual se utilizará la **distribución t-Student** y la **distribución F de Fisher**.

Modelos Logarítmicos: El Caso Log-Log

Al aplicar logaritmo natural a ambos lados

  • Este es un **modelo econométrico Log-Log**, que es **lineal en parámetros** y no lineal a nivel de las variables.
  • Esta formulación ofrece la ventaja de poder interpretar los parámetros de las variables explicativas como **elasticidades**.

Entradas relacionadas: