Conceptos Clave de Econometría: Endogeneidad, Heterocedasticidad y Modelos de Elección
Clasificado en Matemáticas
Escrito el en
español con un tamaño de 7,95 KB
Problemas de Especificación y Variables Instrumentales (VI)
Endogeneidad
La endogeneidad es un problema crítico que surge cuando una variable explicativa está correlacionada con el término de error. Las causas más comunes son la omisión de variables relevantes o la simultaneidad (causalidad inversa).
Ejemplo: En un modelo que relaciona salarios con educación, una variable no observada como la habilidad innata puede afectar tanto al nivel educativo alcanzado como al salario, generando endogeneidad.
El estimador de Mínimos Cuadrados Ordinarios (MCO) se vuelve sesgado e inconsistente si existe esta correlación, es decir, si Cov(X, u) ≠ 0.
La fórmula del estimador MCO es:
β̂_MCO = (X'X)⁻¹X'Y
Solución: Variables Instrumentales (VI)
Una variable instrumental (Z) es una variable que permite obtener una estimación consistente de los coeficientes. Debe cumplir tres condiciones:
- Relevancia: El instrumento debe estar correlacionado con la variable endógena (X). Matemáticamente,
Cov(Z, X) ≠ 0. - Exogeneidad: El instrumento no debe estar correlacionado con el término de error (u). Matemáticamente,
Cov(Z, u) = 0. - Restricción de exclusión: El instrumento solo afecta a la variable dependiente (Y) a través de la variable endógena (X), y no directamente.
El estimador de VI se calcula como:
β̂_VI = (Z'X)⁻¹Z'Y
La varianza del estimador de VI es inversamente proporcional a la correlación entre el instrumento y la variable endógena (ρ_ZX):
Var(β̂_VI) = σ² / (n * σ_Z² * ρ_ZX²)
Heterocedasticidad
Definición y Detección
La heterocedasticidad ocurre cuando la varianza del término de error no es constante para todas las observaciones (Var(uᵢ) ≠ constante). Aunque el estimador MCO sigue siendo insesgado, deja de ser eficiente (no es el de mínima varianza) y los errores estándar son incorrectos, invalidando las pruebas de hipótesis.
Existen varias pruebas para detectarla:
- Prueba de Goldfeld-Quandt: Compara la Suma de Cuadrados de los Residuos (SCR) de dos submuestras de los datos, ordenadas por la variable que se sospecha que causa la heterocedasticidad.
- Prueba de White: Es una prueba más general. Utiliza una regresión auxiliar de los residuos al cuadrado (e²) sobre las variables explicativas originales, sus cuadrados y sus interacciones.
- Prueba de Breusch-Pagan (BP): Regresiona los residuos al cuadrado (e²) sobre las variables explicativas originales para detectar una relación lineal entre ellas y la varianza del error.
Corrección: Mínimos Cuadrados Generalizados (MCG)
La solución a la heterocedasticidad es utilizar Mínimos Cuadrados Generalizados (MCG), que es un estimador eficiente en estas condiciones. El método consiste en transformar el modelo original ponderando las observaciones.
- Modelo transformado: Se divide cada observación por la desviación estándar del error, si se conoce. Un método práctico es ponderar por una variable que se cree que está relacionada con la varianza.
- Matriz de varianzas-covarianzas (Ω): En presencia de heterocedasticidad, la matriz de varianzas-covarianzas del error no es escalar, sino diagonal:
Ω = diag(σ₁², σ₂², ..., σₙ²). - Estimador MCG: La fórmula del estimador es:
β̂_MCG = (X'Ω⁻¹X)⁻¹X'Ω⁻¹Y
Modelos de Elección Binaria
Estos modelos se utilizan cuando la variable dependiente es dicotómica (toma valores de 0 o 1).
Modelo de Probabilidad Lineal (MPL)
El MPL aplica MCO a un modelo donde la variable dependiente es binaria. La interpretación de los coeficientes es directa como un cambio en la probabilidad.
P(Y=1|X) = β₀ + β₁X₁ + ... + βₖXₖ
Su principal desventaja es que puede predecir probabilidades fuera del rango lógico [0, 1].
Modelo Logit
El modelo Logit utiliza la función de distribución logística acumulada para asegurar que las probabilidades predichas se mantengan entre 0 y 1.
P(Y=1|X) = e^(Xβ) / (1 + e^(Xβ))
Modelo Probit
El modelo Probit utiliza la función de distribución normal estándar acumulada (Φ) para modelar la probabilidad.
P(Y=1|X) = Φ(Xβ)
El efecto marginal (el cambio en la probabilidad ante un cambio unitario en una variable Xⱼ) se calcula como:
∂P/∂Xⱼ = φ(Xβ)βⱼ
Donde φ es la función de densidad de probabilidad normal estándar.
Estimación por Máxima Verosimilitud (EMV)
La Estimación por Máxima Verosimilitud (EMV) es un método para estimar los parámetros de un modelo estadístico. Consiste en encontrar los valores de los parámetros que maximizan la probabilidad (o verosimilitude) de observar los datos muestrales.
Función de Verosimilitud
La función de verosimilitud (FV) es el producto de las funciones de densidad de cada observación:
FV = Π f(xᵢ; θ)
Para simplificar los cálculos, se suele maximizar el logaritmo de la función de verosimilitud (log-verosimilitud):
ln(FV) = Σ ln(f(xᵢ; θ))
Ejemplo: Distribución Exponencial
Para una muestra de una distribución exponencial con función de densidad f(x) = (1/β) * e^(-x/β), el estimador de máxima verosimilitud para el parámetro β es la media muestral:
β̂ = (Σ xᵢ) / n
Fórmulas Estadísticas Clave
Estimación por Mínimos Cuadrados Ordinarios (MCO)
- Estimador de la pendiente (β₁):
β̂₁ = (Σxy) / (Σx²) - Estimador del intercepto (β₀):
β̂₀ = Ȳ - β̂₁X̄
Cálculo de Varianzas
- Varianza del estimador MCO:
Var(β̂) = σ²(X'X)⁻¹ - Estimador insesgado de la varianza del error (σ²):
s² = SCR / (n-k-1)
Medidas de Bondad de Ajuste
- Coeficiente de determinación (R²): Mide la proporción de la varianza de la variable dependiente que es predecible a partir de las variables independientes.
R² = 1 - (SCR / SCT)- R² ajustado: Ajusta el R² por el número de regresores en el modelo para evitar que aumente artificialmente al añadir más variables.
R²_ajustado = 1 - [(SCR/(n-k-1)) / (SCT/(n-1))]
Conclusiones y Recomendaciones Prácticas
- Antes de confiar en los resultados de MCO, es fundamental verificar la condición de exogeneidad (
Cov(X, u) = 0). - Al utilizar variables instrumentales, la justificación teórica de la exogeneidad del instrumento es tan importante como la evidencia estadística de su relevancia.
- Para modelar probabilidades, utiliza modelos Probit o Logit. El MPL puede ser útil para una primera aproximación a los efectos marginales, pero sus predicciones pueden ser ilógicas.
- Aplica la prueba de White para detectar formas generales de heterocedasticidad. Usa la prueba de Breusch-Pagan si sospechas que la varianza del error depende linealmente de los regresores.
- Al corregir la heterocedasticidad con MCG, es crucial evaluar cómo cambian los errores estándar y la eficiencia de las estimaciones.