Fundamentos de Regresión Lineal: Extrapolación y Multicolinealidad
Clasificado en Matemáticas
Escrito el en
español con un tamaño de 3,61 KB
Regresión Lineal: Conceptos Avanzados
El Riesgo de la Extrapolación
Esto ocurre cuando el sistema presenta un comportamiento muy distinto entre un intervalo y otro. Mientras más lejano del intervalo de ajuste se encuentre el punto bajo estudio, mayor será el error de estimación del modelo. Esto se evita utilizando muestras realmente representativas como datos de ajuste del modelo.
El Problema de la Multicolinealidad
La colinealidad es la asociación, medida a través de la correlación, entre dos variables independientes. Se dice que hay multicolinealidad en los datos cuando existe una relación lineal simultánea entre tres o más variables independientes. Sin embargo, esto no se suele analizar para cada par de variables por separado; primero, porque el proceso sería excesivamente largo, y segundo, porque resultaría difícil evaluar la magnitud general de las relaciones lineales con el fin de tomar una decisión sobre la aceptación o rechazo de los datos debido al grado de multicolinealidad presente en los mismos.
Si existe colinealidad o multicolinealidad, la matriz XTX no se puede invertir (se convierte en una matriz singular) y, por lo tanto, no se puede estimar â. En tal caso, las estimaciones van a ser poco estables, dependiendo del grado de multicolinealidad. A su vez, esto se traduce en que los estimadores pasan a ser poco precisos, es decir, que sus intervalos de confianza aumentan su tamaño. No obstante, la consecuencia más grave consiste en que las estimaciones de los parámetros del modelo toman valores ilógicos desde el punto de vista físico.
¿Cómo detectar la multicolinealidad?
Existen varios métodos para detectar la multicolinealidad, de los cuales el más efectivo es el del Número o Índice de Condición. Este índice se aplica sobre la matriz de datos X y se denota por K(X). Su resultado indica el grado de multicolinealidad presente en la matriz X. Este indicador se calcula a través de la siguiente expresión:
K(X) = λmax / λmin
En donde λmax y λmin son el mayor y el menor autovalor de XTX, respectivamente.
El grado de multicolinealidad de X es aceptable si K(X) ≤ 10 (de hecho, K(X) = 10 significa multicolinealidad leve), y a partir de 20 se considera como multicolinealidad fuerte.
Estrategias de Resolución
Cuando el grado de multicolinealidad de X es inaceptable, se deben considerar las siguientes opciones:
- Eliminación de variables: Se debe eliminar alguna de las variables, por ejemplo, aquella que posea la mayor correlación con alguna otra variable independiente, pero que presente la menor correlación con la variable dependiente. Luego se evalúa la matriz X resultante y se continúa de la misma manera hasta que K(X) ≤ 10.
- Método de Componentes Principales: Otra opción es utilizar el método de los componentes principales para generar las nuevas variables, ya que los componentes principales tienen la propiedad de ser incorrelacionados.