Metodología para la Construcción y Validación de Modelos de Regresión Predictiva
Clasificado en Magisterio
Escrito el en
español con un tamaño de 3,53 KB
Metodología de Regresión: Fases Clave para la Modelización Predictiva
I. Métodos de Extracción y Selección del Modelo
Se trata de determinar cuál es el método de selección más adecuado al problema de investigación.
Cuando no es posible determinarlo directamente, el investigador debe encontrar el “mejor” modelo de regresión mediante métodos de búsqueda secuencial (hacia delante o hacia atrás) o procesos combinatorios (paso a paso).
El “mejor” modelo de regresión será aquel que aúne una adecuada capacidad explicativa de las variables pronosticadoras con el principio de parsimonia.
II. Valoración de la Significación Estadística
Una vez elegido el método de selección, se debe valorar si la capacidad predictiva de los modelos de regresión es significativamente mayor que la que se obtendría con un pronóstico al azar.
La hipótesis nula ($ ext{H}_0$) del ANOVA es que la predicción con el modelo de regresión es igual a la que se obtendría al azar.
III. Capacidad Explicativa del Modelo
Una tarea importante es determinar la medida en que las variables pronosticadoras ayudan a explicar la variabilidad en los valores de la variable criterio. Para valorarlo, se debe examinar el coeficiente de determinación ($ ext{R}^2$) que resulta de elevar al cuadrado el coeficiente de correlación múltiple ($ ext{R}$).
Este valor de $ ext{R}$ deriva de correlacionar la variable criterio con la combinación lineal de las variables pronosticadoras que haya en cada modelo de regresión.
IV. Detección de Observaciones Influyentes
Algunos de los casos pueden tener un peso específico mayor a la hora de determinar por dónde pasará la recta de regresión. Es crucial identificar estas observaciones influyentes o casos extremos, ya que pueden distorsionar los resultados del modelo.
V. Interpretación de los Resultados
En la fase de interpretación, hay que llevar a cabo dos tareas importantes:
- Interpretar la ecuación de regresión: Valorar en qué medida varían los valores de la variable criterio por cada variación unitaria de las variables pronosticadoras (coeficientes de regresión).
- Determinar la importancia relativa: Establecer la importancia relativa de cada una de las variables pronosticadoras en la explicación de la variable criterio mediante un examen de la presencia de efectos de multicolinealidad entre las variables pronosticadoras.
VI. Validación Empírica del Modelo
En la modelización de regresión es especialmente valioso proceder a validar empíricamente los resultados obtenidos.
Método de Validación Habitual: Submuestreo
El método más habitual de validación consiste en realizar un submuestreo. Si con la aplicación del submuestreo se pueden alcanzar las mismas conclusiones que con la muestra original, entonces los resultados quedan validados.
Procedimientos Alternativos de Validación
Además del submuestreo, se podría replantear el proceso de regresión mediante otros procedimientos:
- Probar con otras variables alternativas que puedan representar a las variables originales.
- Realizar el análisis excluyendo aquellos casos que se puedan considerar como observaciones influyentes o casos extremos.
- Utilizar diversos procedimientos de selección y comparar los resultados de esos métodos.
- Obtener muestras adicionales para validar los resultados mediante el estadístico Press.