Clasificación discriminante multiclase para segmentar consumidoras de cerveza

Clasificado en Matemáticas

Escrito el en español con un tamaño de 3,43 KB

Análisis discriminante (múltiple)

Objetivo: Identificar las variables relevantes para clasificar a los encuestados usando un modelo óptimo de clasificación para futuros datos, tomando como base la opinión y hábitos de consumo de cerveza en las mujeres.

Variables involucradas

PONER preguntas REC. en SPSS

Variable dependiente

KM4_p6. Categorías: 1: cluster 1 ... 4: cluster 4 — múltiples porque hay más de dos categorías (n-1 = 3 fd). Escala: no métrica, nominal, no dicotómica.

Variable independiente

P6.1 — solo para mujeres hasta la P6.7 (quita feminidad). Escala: métrica, intervalo, directa, no forzada, no sesgada. Codificación: 1: TD, 5: TA.

Primera corrida (stepwise)

Ver "Variables not in the analysis" en SPSS.
En este ejemplo el método paso a paso sugiere que la variable P6.7 (quita feminidad) no es relevante para clasificar a los encuestados.

Segunda corrida (introducir independientes)

Introducir las independientes juntas; quitar las no relevantes. Sacar frecuencias con el cluster en SPSS y revisar la tabla % classification results.

Resultados de clasificación

  • PCC: 90.5% de las observaciones fueron clasificadas correctamente (esto está abajito en letras pequeñas).
  • Tabla: frecuencias / porcentaje mínimo de clasificaciones correctas.
  • PMCC: (valid percent .00)2 + (poner los 4 de los clusters) = "sacarlo".
  • 27.9% de los clientes se clasifican correctamente si los repartiéramos al azar en los segmentos.
Comparación:
  • Modelo discriminante al azar
  • PCC: 90.5%      vs.      PMCC: 27.9% — el modelo es muy bueno para clasificar, cercano al 100%.

Ecuaciones del modelo discriminante

En SPSS: tabla Canonical.
Ejemplo de función discriminante (FD1):
FD1i = (.807)·(pregunta correspondiente i) + (...)
— Poner todos los coeficientes que aparecen en esa línea.

Matriz de estructuras

FD1: escribir solo el nombre de las variables que tienen * y revisar el signo. Si tienen el mismo signo se interpreta como "y"; si tienen signo diferente, se interpreta como "vs".
Carga.      Var.
Número.      Pregunta
— Hacer lo mismo para todas las funciones discriminantes (FDs).

Mapa de posicionamiento

SPSS proporciona el mapa (va a ser directo).
FD1 X — eje X; FD2 Y — eje Y. Interpretar cuadrantes / grupos.

Clasificación de un caso: Montse

¿A qué clase pertenece Montse? (esto me lo da Magui y yo contesto su encuestita).
Procedimiento:
  • Sustituir en las ecuaciones los valores de la encuesta de las preguntas: FD1m.
  • Graficar a Montse y, en base a eso, sacar la conclusión final si compraría o no cerveza.
  • También graficar la FD3, ya que esa no estaba en el mapa.
Notas finales
Mantener todos los resultados y tablas de SPSS para la verificación. Revisar las clasificaciones erróneas y considerar la inclusión o exclusión de variables según su contribución a las funciones discriminantes.

Entradas relacionadas: