Modelos Econométricos Avanzados: Estimación de Sistemas y Predicción de Elección Binaria

Clasificado en Diseño e Ingeniería

Escrito el en español con un tamaño de 7,92 KB

Modelos de Ecuaciones Simultáneas

Los modelos de ecuaciones simultáneas están formados por un conjunto de ecuaciones de regresión e identidades matemáticas que representan las relaciones de un sistema económico. Estos modelos incluyen variables endógenas (Y) y variables predeterminadas (que pueden ser endógenas retardadas o exógenas actuales y retardadas). Los parámetros de la forma reducida tienen carácter de multiplicador, sintetizando los efectos directos e indirectos de unas variables sobre otras.

Problemas de Estimación y Soluciones

Si la forma estructural se estima de forma individual, las estimaciones resultan sesgadas e inconsistentes.

Enfoque Directo: Mínimos Cuadrados Ordinarios (MCO)

La aplicación directa de Mínimos Cuadrados Ordinarios (MCO) presenta un problema de simultaneidad. Dado que existen variables endógenas como explicativas, se produce un problema de regresores estocásticos, lo que hace que las estimaciones por MCO sean inconsistentes.

Contraste de Hausman

Para verificar si este problema existe, se utiliza el Contraste de Hausman. Este contraste determina si una variable explicativa está correlacionada con la perturbación estocástica. Si lo está, se trata de un caso de regresores estocásticos, y MCO no es apropiado porque las estimaciones serían sesgadas, ineficientes e inconsistentes. El procedimiento es el siguiente:

  1. Realizar una regresión de la variable considerada sospechosa sobre todas las variables exógenas del sistema y guardar los valores estimados de los residuos.
  2. Realizar la regresión de la ecuación de la forma estructural añadiendo los residuos estimados del paso 1. Si el coeficiente de los residuos es estadísticamente significativo, se acepta el problema de simultaneidad.

En este caso, se debe utilizar el método de Mínimos Cuadrados en Dos Etapas (MC2E).

Enfoque de Información Limitada

Mínimos Cuadrados Indirectos (MCI)

El método de Mínimos Cuadrados Indirectos (MCI) es aplicable si alguna o todas las ecuaciones están exactamente identificadas. Las estimaciones son consistentes y asintóticamente eficientes, aunque sesgadas en muestras pequeñas. El procedimiento es:

  1. Estimar todas las ecuaciones de la forma reducida por MCO y obtener las estimaciones de los parámetros (πt).
  2. Despejar los parámetros de la forma estructural a partir de los parámetros de la forma reducida.
Mínimos Cuadrados en Dos Etapas (MC2E)

El método de Mínimos Cuadrados en Dos Etapas (MC2E) es utilizado cuando las ecuaciones están sobreidentificadas. El procedimiento es:

  1. Estimar todas las ecuaciones de la forma reducida por MCO y obtener los valores estimados de todas las variables endógenas.
  2. Estimar las ecuaciones de la forma estructural, sustituyendo las variables endógenas por los valores obtenidos en el paso 1.

Las estimaciones son consistentes si no hay variables endógenas retardadas; de lo contrario, pueden ser inconsistentes o sesgadas. Otros métodos relacionados son Variables Instrumentales (VI) y Mínimos Cuadrados en Dos Etapas con Variables Instrumentales (MVIL), aplicables si las ecuaciones son identificables (exacta o sobreidentificación).

Enfoque de Información Completa

Mínimos Cuadrados en Tres Etapas (MC3E)

El método de Mínimos Cuadrados en Tres Etapas (MC3E) solo es aplicable si el sistema está identificado. Se utiliza para evitar problemas de autocorrelación o heterocedasticidad. Las dos primeras etapas son idénticas a MC2E; la tercera etapa consiste en estimar las ecuaciones aplicando el método de Mínimos Cuadrados Generalizados (MCG).

Máxima Verosimilitud de Información Completa (MVCOMPLEJA)

Este método es aplicable bajo la hipótesis de normalidad.

Modelos SURE (Seemingly Unrelated Regressions)

Estos modelos consisten en un conjunto de ecuaciones aparentemente no relacionadas, donde en cada ecuación solo existe una variable endógena. Se estiman utilizando el método de Mínimos Cuadrados Generalizados (MCG).

Modelos VAR (Vector Autorregresivo)

Los modelos VAR son ecuaciones simultáneas que suponen que todas las variables son endógenas. Se utilizan principalmente para fines predictivos o para analizar fenómenos de causalidad. Si las variables del vector y sus coeficientes (βt) son estacionarios, las estimaciones se pueden obtener por MCO. Los regresores en los modelos VAR son estocásticos porque aparecen variables endógenas retardadas; sin embargo, si hay suficientes retardos, no habrá autocorrelación en la perturbación, por lo que el estimador MCO será consistente y tendrá una distribución normal en muestras grandes.

Función Impulso-Respuesta (FIR)

La Función Impulso-Respuesta (FIR) analiza las desviaciones de la evolución esperada de las variables en el tiempo ante un shock imprevisto. Describe el efecto de un shock unitario en la i-ésima variable (medido numéricamente por una desviación estándar de la perturbación ui) sobre el valor presente y futuro de todas las variables endógenas del sistema, incluida ella misma.

Contrastes de Causalidad y Exogeneidad

Contraste de Causalidad de Sims

Si existe causalidad en el futuro, debería guardar relación con el presente.

Contraste de Causalidad de Granger

Una variable Yt causa a otra variable Xt si el pasado de Yt es relevante para predecir Xt.

Modelos de Elección Binaria

Modelo de Probabilidad Lineal (MPL)

El Modelo de Probabilidad Lineal (MPL) describe el cambio en la probabilidad de la variable endógena ante una variación unitaria de la variable exógena. El problema principal es que el impacto de un aumento unitario de X en la probabilidad es constante, lo cual no tiene sentido en un contexto probabilístico. Además, el MPL puede predecir probabilidades menores que cero o mayores que uno. Las perturbaciones son heterocedásticas y siguen una distribución de Bernoulli.

Modelo Probit

El Modelo Probit modeliza la probabilidad de que Y=1 utilizando la función de distribución normal acumulada estándar. Es apropiado para muestras grandes. Las estimaciones son consistentes, tienen una distribución normal y son asintóticamente eficientes. Las desviaciones típicas se calculan automáticamente; sin embargo, es recomendable usar desviaciones típicas robustas para evitar problemas de heterocedasticidad. Se utilizan contrastes e intervalos de confianza para la inferencia. El R² y el R² corregido carecen de validez en este contexto.

Medidas para Evaluar el Ajuste

  • Proporción Correctamente Predicha: Indica la proporción de veces que la predicción de Y (0 o 1) coincide con el resultado verdadero.
  • R² de McFadden: Mide el ajuste del modelo mediante la verosimilitud, comparándola respecto al caso en que no hubiera variables explicativas (X).

Regresión Logit

La Regresión Logit calcula la probabilidad de que Y=1 utilizando la función de distribución acumulada logística estándar: Pr(Y=1|X) = 1 / (1 + e-(β0 + β1X)).

Ventajas de los Modelos Probit y Logit

  • Los valores estimados de la probabilidad se encuentran entre cero y uno.
  • La varianza de la probabilidad es una función no lineal de una expresión lineal.
  • No exigen que exista homocedasticidad.
  • Los resultados son muy similares en cuanto a los valores de los parámetros estimados, la significatividad y el grado de ajuste.

Entradas relacionadas: