Análisis de Componentes Principales: Guía Práctica y Optimización
Clasificado en Matemáticas
Escrito el en español con un tamaño de 3,43 KB
ACP. Como podemos ver, trabajamos con un gran número de observaciones, claramente superior a 50. Además, se supera la ratio deseada de variables y observaciones (1:10), ya que hay … variables y … observaciones.
En la matriz de correlaciones que encontramos en la página siguiente vemos que existe una cantidad razonable de correlaciones elevadas (consideraremos que se trata de una correlación elevada si es > |0,3|).
Si atendemos al valor del determinante de la matriz de la página anterior, nos damos cuenta de que su valor es muy próximo a 0. Esto es un claro indicativo de que las variables que nos ocupan están linealmente relacionadas.
Ahora atenderemos a los valores que adopta la diagonal principal de la matriz de correlación anti-imagen (es decir, la matriz de correlaciones parciales multiplicada por -1).
En este caso, vemos que todos los valores de la diagonal son razonablemente grandes –superiores a 0,5. Excepto… Necesario eliminar variables menores a 0,5. Una vez eliminada la variable anterior, todos los valores de la diagonal principal de la matriz de correlación anti-imagen –todas las medidas de adecuación muestral– son superiores a 0,5. Por tanto, las variables son adecuadas para el ACP.
Se llevará a cabo un contraste en el que se plantean las siguientes hipótesis:
Ho: R=1; H1: R≠I
- Se rechaza la hipótesis nula. Por tanto, las variables están correlacionadas e interesa llevar a cabo un análisis ACP. 0,00 < 0,05 = alfa
Ahora decidiremos el número de componentes adecuado para nuestro análisis. Si atendemos a la tabla varianza total explicada, y considerando el criterio que dice que podemos retener tantos componentes como autovalores mayores a 1 existan, utilizaremos ….(3) componentes.
Además, vemos que el porcentaje de varianza acumulado es del 93,549% (del 3*). Esta situación es muy buena, ya que el dato es considerablemente superior al 60%, que es el porcentaje mínimo deseable en estudios de la rama de las Ciencias Sociales.
(El gráfico de sedimentación siguiente corrobora la hipótesis que hemos formulado anteriormente. Esto se debe a que, si atendemos al cambio de tendencia, diríamos que el número de componentes adecuado es 4. No obstante, es muy frecuente que el diagrama de sedimentación señale una componente más que el resto.)
La tabla siguiente recoge las comunalidades, esto es, la varianza de cada variable recogida en el factor. Vemos que todos los valores son muy elevados (superiores a 0,5), por tanto, no nos planteamos eliminar ninguna variable del análisis. Esto se debe a que la varianza de las variables está bien representada por la solución factorial.
Como los valores de ambas tablas (matriz componente y rotado) son muy parecidos, con el fin de poder establecer una clasificación lo más adecuada posible, utilizaremos la matriz de componentes rotados (método Varimax), ya que utiliza ejes ortogonales.
(Agrupar por componentes y nombres inventarse de la M.C rotado). Comentar a partir del grafico cubo.)
Para finalizar, diremos que una de las principales aplicaciones del ACP es que posibilita la realización de un análisis de regresión (y, por tanto, podríamos formular predicciones), ya que las componentes son linealmente independientes. Sin embargo, si utilizáramos las variables, al estar correlacionadas tendríamos un problema de multicolinealidad.