Modelos de Probabilidad Lineal y No Lineal: Aplicación Econométrica y Limitaciones del MPL
Clasificado en Matemáticas
Escrito el en
español con un tamaño de 7,68 KB
Parte 1. Modelos de Probabilidad Lineal (MPL) y No Lineal (Probit y Logit)
a) Diferencias y Limitaciones
Discuta las principales diferencias entre los modelos de probabilidad lineal (MPL) y no lineal (Probit y Logit). ¿Qué limitaciones presenta el modelo MPL y qué ventajas presentan los modelos Probit y Logit?
Limitaciones del Modelo de Probabilidad Lineal (MPL)
El MPL, aunque simple y fácil de interpretar, presenta serias limitaciones cuando la variable dependiente es binaria (0 o 1):
- Predicciones fuera de rango: El MPL predice probabilidades que pueden ser menores que cero o mayores que uno. Esto es inconsistente con la definición de probabilidad.
- Heteroscedasticidad: El error del MPL es inherentemente heteroscedástico, lo que invalida los errores estándar y las pruebas de significancia tradicionales.
- Efectos marginales constantes: El efecto marginal de una variable explicativa es constante, lo cual es poco realista, ya que el impacto de un cambio en $X$ sobre la probabilidad de $Y=1$ debería depender del nivel actual de $X$.
Ventajas de los Modelos Probit y Logit
Los modelos Probit y Logit superan las limitaciones del MPL al utilizar una función de distribución acumulada (FDA) para transformar la regresión lineal en una probabilidad:
- Rango de probabilidad: Garantizan que las probabilidades predichas se encuentren siempre entre 0 y 1.
- Efectos marginales no lineales: Los efectos marginales son variables, lo que permite que el impacto de una variable sobre la probabilidad sea mayor o menor dependiendo del punto de partida.
- Distribución del error: El modelo Logit asume que el error sigue una distribución logística, mientras que el modelo Probit asume una distribución normal estándar.
b) Aplicación del Modelo de Probabilidad Lineal
Sea $arr86$ una variable binaria igual a uno si un hombre fue arrestado en 1986 e igual a cero si no fue así. La población es un grupo de hombres de California nacidos en 1960 o en 1961, que habían sido detenidos al menos una vez antes de 1986. Un modelo de probabilidad lineal para describir $arr86$ es:
$arr86 = \beta_0 + \beta_1 pcnv + \beta_2 avgsen + \beta_3 tottime + \beta_4 ptime86 + \beta_5 qemp86 + U$
Definición de Variables
- $pcnv$: Proporción de arrestos previos que condujeron a una condena.
- $avgsen$: Sentencia promedio cumplida en condenas previas (en meses).
- $tottime$: Meses en prisión desde los 18 años de edad anteriores a 1986.
- $ptime86$: Meses en prisión en 1986.
- $qemp86$: Cantidad de trimestres (0 a 4) que el hombre estuvo empleado legalmente en 1986.
Ecuación Estimada
La ecuación estimada es:
$arr86 = 0.52 - 0.17 pcnv + 0.0073 avgsen + 0.0054 tottime + 0.031 ptime86 + 0.053 qemp86$
Datos de la estimación: $n=3000$, $R^2= 0.175$
Cuestionario y Resolución
1. Interpretación del Coeficiente de Posición (Intercepto)
Interpretación: El coeficiente de posición (intercepto), $\beta_0 = 0.52$, representa la probabilidad predicha de que un hombre sea arrestado en 1986 cuando todas las variables explicativas son iguales a cero ($pcnv=0$, $avgsen=0$, $tottime=0$, $ptime86=0$, $qemp86=0$).
Se interpreta que, para un hombre con las características base (cero en todas las variables explicativas), la probabilidad de ser arrestado en 1986 es del 0.52 o 52%.
2. Interpretación de los Signos de las Variables $pcnv$ y $qemp86$
Interprete los signos de las variables $pcnv$ y $qemp86$. ¿Tienen sentido? Argumente.
Signo de $pcnv$ (Proporción de condenas)
El coeficiente de $pcnv$ es $\beta_1 = -0.17$ (negativo).
Interpretación: Un aumento en la proporción de arrestos previos que condujeron a una condena (manteniendo las demás variables constantes) disminuye la probabilidad de ser arrestado en 1986. Esto tiene sentido, ya que una mayor certeza de castigo (condena) actúa como un factor disuasorio o de disuasión, reduciendo la reincidencia.
Signo de $qemp86$ (Trimestres empleado)
El coeficiente de $qemp86$ es $\beta_5 = 0.053$ (positivo).
Interpretación: Un aumento en el número de trimestres que el hombre estuvo empleado legalmente en 1986 aumenta la probabilidad de ser arrestado en 1986. Este signo es contraintuitivo, ya que se esperaría que el empleo legal redujera la probabilidad de actividad delictiva. Este resultado podría indicar la presencia de sesgo de variable omitida o que, en esta muestra específica, los hombres empleados legalmente también tienen una mayor exposición a situaciones que conducen al arresto (aunque no necesariamente a la condena).
3. Predicción si $pcnv$ disminuye en 0.8 unidades
¿Qué puede predecir si $pcnv$ disminuye en 0.8 unidades?
En el Modelo de Probabilidad Lineal, el coeficiente $\beta_1$ representa el cambio en la probabilidad de $Y=1$ ante un cambio unitario en $X_1$.
Si $pcnv$ disminuye en 0.8 unidades, el cambio en la probabilidad de arresto ($arr86$) se calcula como:
$\Delta arr86 = \beta_1 \times \Delta pcnv$
$\Delta arr86 = (-0.17) \times (-0.8)$
$\Delta arr86 = 0.136$
Predicción: Se predice que la probabilidad de que el hombre sea arrestado en 1986 aumentaría en 0.136, lo que equivale a un aumento de 13.6 puntos porcentuales.
4. Interpretación del Coeficiente $R^2$ y adición de variables
Interprete el coeficiente $R^2 = 0.175$ y argumente ¿en qué caso convendría agregar una nueva variable explicativa al modelo?
Interpretación del $R^2$
El coeficiente de determinación $R^2 = 0.175$ indica que el 17.5% de la variación total en la variable dependiente ($arr86$, la probabilidad de arresto) es explicada por las variables independientes incluidas en el modelo ($pcnv$, $avgsen$, $tottime$, $ptime86$, $qemp86$).
Para un modelo de regresión con datos de corte transversal, especialmente uno que utiliza una variable dependiente binaria (MPL), este valor puede considerarse bajo, lo que sugiere que una gran parte de la variabilidad (el 82.5%) permanece sin explicar y está contenida en el término de error.
Conveniencia de Agregar Variables
Convendría agregar una nueva variable explicativa al modelo en los siguientes casos:
- Mejora del poder explicativo: Si se sospecha que existe una variable relevante que influye en $arr86$ y que actualmente está contenida en el término de error ($U$). Agregar esta variable podría aumentar el $R^2$ y hacer el modelo más fiable.
- Reducción del Sesgo de Variable Omitida: Si la variable omitida está correlacionada con alguna de las variables explicativas ya incluidas (por ejemplo, si la educación o el historial familiar de arrestos influyen tanto en el empleo como en la probabilidad de arresto), su omisión provoca que los coeficientes estimados estén sesgados. Agregar la variable omitida es crucial para obtener estimaciones insesgadas de los coeficientes existentes.