Criterios de Interpretación y Validación de Modelos Estadísticos Multivariantes

Clasificado en Matemáticas

Escrito el en español con un tamaño de 5 KB

AFC (Análisis Factorial de Correspondencias)

Se utiliza para 2 variables cualitativas dependientes. La asociación entre las variables se mide, a menudo, utilizando el estadístico Chi-cuadrado (si es menor que 0,5, indica una relación significativa entre las variables).

Estudio de Perfiles (Fila/Columna)

  • Si los perfiles fila son parecidos al perfil medio, indica que la variable fila es similar en todas las categorías de la otra variable (son independientes, no destacan).
  • Si dos filas tienen perfiles parecidos, indica una fuerte asociación entre ellas y aparecerán cerca en el mapa de correspondencias.

Masa

Representa el porcentaje total de frecuencias: para cada columna (perfiles fila) y para cada marca (perfil columna).

Proporción de Inercia

Indica la información que proporciona cada una de las dimensiones obtenidas. Generalmente, nos quedamos con las dos primeras dimensiones, ya que son las que mejor resumen la variabilidad.

Contribución Total

Mide la información que rescata cada variable. Para que una variable esté bien representada, su contribución debe ser mayor a 0,6 (aunque un valor menor a 0,5 indica una representación deficiente). Una contribución baja implica cercanía al origen; una alta, lejanía.

AFCM (Análisis Factorial de Correspondencias Múltiples)

Se aplica cuando se tienen 3 o más variables cualitativas.

Alfa de Cronbach

Se utiliza para evaluar la validez del modelo. Toma valores entre 0 y 1; si su media es mayor que 0,7, se considera suficiente.

Interpretación de Variables en AFCM

  • Las variables alejadas del origen reflejan una mayor contribución a las distribuciones (valores de discriminación altos).
  • Aquellas variables próximas entre sí indican patrones de relación o asociación.
  • Las variables cercanas al origen no suelen ser relevantes para la interpretación de las dimensiones.
  • Aquellas con valores más altos tienen mayor peso al definir una dimensión específica.

CLUSTER (Análisis de Conglomerados)

Requiere que las variables estén medidas en las mismas unidades. Los métodos comunes incluyen la Distancia Euclídea y el método de conglomeración de Ward o Inter.

Representación y Homogeneidad

El resultado se representa mediante un Dendrograma:

  • Dos clústeres son distintos si sus ramas son largas.
  • Si las ramas son cortas, el grupo se considera homogéneo.

LOGIT (Regresión Logística Binaria)

La variable dependiente (Y) es cualitativa binaria y se codifica como 0 y 1. Las variables independientes pueden ser cualitativas, cuantitativas o ambas. (Nota: En la regresión, las variables cualitativas son transformadas por el software, como SPSS, en variables dummy o ficticias).

Chi-Cuadrado (Validez del Modelo)

Para la validez del modelo, una significación cuanto más próxima a 1, mejor es el ajuste (indicando que el modelo no difiere significativamente del modelo saturado).

Clasificación Individual

Si la probabilidad pronosticada es menor que 0,5, se asigna a la categoría 0; si es mayor, se asigna a la categoría 1.

Capacidad Explicativa de las Variables

  1. Método 1: Estadístico Wald y Significación. Una significación menor a 0,05 indica que la variable tiene peso significativo en la ecuación.
  2. Método 2: Intervalo de Confianza (IC). Si el valor 1 está incluido en el intervalo de confianza del coeficiente (exp(B)), el coeficiente es 0, lo que implica que la variable no tiene efecto sobre la variable dependiente.

RLM (Regresión Lineal Múltiple)

Requiere variables dependientes e independientes métricas.

Bondad del Ajuste

  • El R Cuadrado (R²) varía entre 0 y 1; cuanto más cerca de 1, mejor es el ajuste.
  • Cuanto más pequeño sea el error estándar de la estimación, mejor es el ajuste.

Si las variables están en distintas unidades, se utilizan los coeficientes tipificados. Aquellos más alejados de 0 son los de mayor peso en la formación de la ecuación.

Significación (p-valor)

Es la probabilidad de que los coeficientes no tengan capacidad explicativa. Si esta probabilidad es inferior a 0,05, se afirma la capacidad explicativa del coeficiente.

Estadístico T

Valora la capacidad explicativa de los coeficientes individuales a través de su significación asociada.

Intervalos de Confianza (IC)

Si el intervalo de confianza contiene el valor 0, significa que el coeficiente para esa variable puede ser 0, por lo que la variable puede eliminarse del modelo (no es significativa).

Contraste ANOVA (Validez Global del Modelo)

La significación del estadístico F debe ser pequeña (menor a 0,05) para aceptar el modelo como válido globalmente.

Entradas relacionadas: