Clasificación discriminante multiclase para segmentar consumidoras de cerveza
Clasificado en Matemáticas
Escrito el en
español con un tamaño de 3,43 KB
Análisis discriminante (múltiple)
Objetivo: Identificar las variables relevantes para clasificar a los encuestados usando un modelo óptimo de clasificación para futuros datos, tomando como base la opinión y hábitos de consumo de cerveza en las mujeres.
Variables involucradas
PONER preguntas REC. en SPSS
Variable dependiente
KM4_p6. Categorías: 1: cluster 1 ... 4: cluster 4 — múltiples porque hay más de dos categorías (n-1 = 3 fd). Escala: no métrica, nominal, no dicotómica.
Variable independiente
P6.1 — solo para mujeres hasta la P6.7 (quita feminidad). Escala: métrica, intervalo, directa, no forzada, no sesgada. Codificación: 1: TD, 5: TA.
Primera corrida (stepwise)
Ver "Variables not in the analysis" en SPSS.
En este ejemplo el método paso a paso sugiere que la variable P6.7 (quita feminidad) no es relevante para clasificar a los encuestados.
Segunda corrida (introducir independientes)
Introducir las independientes juntas; quitar las no relevantes. Sacar frecuencias con el cluster en SPSS y revisar la tabla % classification results.
Resultados de clasificación
- PCC: 90.5% de las observaciones fueron clasificadas correctamente (esto está abajito en letras pequeñas).
- Tabla: frecuencias / porcentaje mínimo de clasificaciones correctas.
- PMCC: (valid percent .00)2 + (poner los 4 de los clusters) = "sacarlo".
- 27.9% de los clientes se clasifican correctamente si los repartiéramos al azar en los segmentos.
Comparación:
- Modelo discriminante al azar
- PCC: 90.5% vs. PMCC: 27.9% — el modelo es muy bueno para clasificar, cercano al 100%.
Ecuaciones del modelo discriminante
En SPSS: tabla Canonical.
Ejemplo de función discriminante (FD1):
FD1i = (.807)·(pregunta correspondiente i) + (...)
— Poner todos los coeficientes que aparecen en esa línea.
Matriz de estructuras
FD1: escribir solo el nombre de las variables que tienen * y revisar el signo. Si tienen el mismo signo se interpreta como "y"; si tienen signo diferente, se interpreta como "vs".
Carga. Var.
Número. Pregunta
— Hacer lo mismo para todas las funciones discriminantes (FDs).
Mapa de posicionamiento
SPSS proporciona el mapa (va a ser directo).
FD1 X — eje X; FD2 Y — eje Y. Interpretar cuadrantes / grupos.
Clasificación de un caso: Montse
¿A qué clase pertenece Montse? (esto me lo da Magui y yo contesto su encuestita).
Procedimiento:
- Sustituir en las ecuaciones los valores de la encuesta de las preguntas: FD1m.
- Graficar a Montse y, en base a eso, sacar la conclusión final si compraría o no cerveza.
- También graficar la FD3, ya que esa no estaba en el mapa.
Notas finales
Mantener todos los resultados y tablas de SPSS para la verificación. Revisar las clasificaciones erróneas y considerar la inclusión o exclusión de variables según su contribución a las funciones discriminantes.