Validación y Evaluación de Modelos de Regresión Lineal

Clasificado en Matemáticas

Escrito el en español con un tamaño de 5,53 KB

Coeficiente de Determinación (R²)

Para determinar el coeficiente de determinación, se debe consultar la tabla resumen del modelo, específicamente el valor de .

Interpretación del Coeficiente de Determinación

Al analizar el ajuste del modelo, se observa que el coeficiente de determinación es (valor R²). Esto indica que el (%) de la variabilidad de la variable dependiente es explicada por el modelo obtenido. La interpretación de este valor es la siguiente:

  • Regular: Si está entre 70% y 80%.
  • Bueno: Si está entre 80% y 90%.
  • Muy bueno: Si está entre 90% y 100%.

Un valor de R² cercano a 1 (o 100%) indica un mejor ajuste del modelo.

Consideración sobre Datos Atípicos

Es importante considerar si es necesario o no eliminar datos atípicos. Esto puede influir en el coeficiente de determinación y en los coeficientes del modelo.

Procedimiento para Explorar Residuos

Para un análisis más profundo de los residuos, siga los siguientes pasos en su software estadístico:

  1. Vaya a Analizar.
  2. Seleccione Estadísticos Descriptivos.
  3. Elija Explorar.
  4. Coloque el último residuo en la fila de la variable dependiente.
  5. En la sección Gráficos, haga clic en Gráfico con prueba de normalidad.
  6. Quite la selección de 'Tallo y hojas'.
  7. Haga clic en Continuar y luego en Aceptar.

Supuestos del Modelo de Regresión Lineal

Para que un modelo de regresión lineal sea válido y sus inferencias sean fiables, debe cumplir con ciertos supuestos clave:

  • Linealidad: La relación entre las variables es lineal.
  • Independencia de los residuos: Los errores no están correlacionados entre sí.
  • Normalidad de los residuos: Los errores se distribuyen normalmente.
  • Homocedasticidad: La varianza de los errores es constante.

Independencia de los Residuos: Prueba de Durbin-Watson

Para verificar la independencia de los residuos, se debe consultar el valor del estadístico Durbin-Watson, que se encuentra en la Tabla Resumen del Modelo B.

Hipótesis para la Prueba de Durbin-Watson

  • H₀: Los residuos son independientes.
  • H₁: Los residuos no son independientes.

Del test de Durbin-Watson, se obtiene un valor de NUMERO. Si este valor se encuentra entre [1.5 y 2.5], no se rechaza H₀. Por lo tanto, se concluye que los residuos son independientes.

Normalidad de los Residuos: Pruebas de Kolmogorov-Smirnov y Shapiro-Wilk

Para evaluar la normalidad de los residuos, se deben considerar las pruebas de Kolmogorov-Smirnov (para muestras ≥ 50) y Shapiro-Wilk (para muestras < 50).

Hipótesis para la Prueba de Normalidad

  • H₀: Los residuos son normales.
  • H₁: Los residuos no son normales.

Como los datos son ≥ 50, se utiliza la prueba de Kolmogorov-Smirnov. De esta prueba, podemos observar que el valor p = 0.200 > 0.005. Por lo tanto, no se rechaza H₀. Esto significa que no hay evidencia significativa para afirmar que los residuos no son normales. En consecuencia, se concluye que los residuos son normales.

Homocedasticidad

Para verificar la homocedasticidad (varianza constante de los residuos), se debe observar el gráfico de dispersión de predicción vs. residuos.

En el gráfico de predicción vs. residuos, se puede observar la presencia de un residuo que se aleja del patrón principal, lo cual se corrobora con el diagnóstico por caso y el gráfico de nube de puntos. Aparentemente, se observa un patrón lineal homocedástico. Se recomienda realizar transformaciones para confirmar si esta suposición se cumple correctamente.

Acciones Post-Diagnóstico

Una vez finalizado el diagnóstico de supuestos, se recomienda eliminar los datos atípicos para observar si esto mejora el R cuadrado y los coeficientes del modelo.

Si los valores varían significativamente después de la eliminación, se debe utilizar este método.

Transformaciones de Datos

Para determinar qué tipo de transformación de datos es la más adecuada, siga los siguientes pasos:

  1. Vaya a Analizar.
  2. Seleccione Regresión.
  3. Elija Estimación Curvilínea.
  4. Coloque la variable dependiente en Y y la variable independiente en X.
  5. Marque las opciones: Lineal, Logarítmica, Inversa, Potencia, Crecimiento, Exponencial.
  6. Haga clic en Aceptar.

Se debe escoger el modelo con el R cuadrado mayor, ya que este indicará la transformación que mejor explica la variabilidad de la variable dependiente.

Entradas relacionadas: