Clasificación discriminante multiclase para segmentar consumidoras de cerveza

Escrito el 16 de Febrero de 2026 en español con un tamaño de 3,43 KB

Análisis discriminante (múltiple)

Objetivo: Identificar las variables relevantes para clasificar a los encuestados usando un modelo óptimo de clasificación para futuros datos, tomando como base la opinión y hábitos de consumo de cerveza en las mujeres.

Variables involucradas

PONER preguntas REC. en SPSS

Variable dependiente

KM4_p6. Categorías: 1: cluster 1 ... 4: cluster 4 — múltiples porque hay más de dos categorías (n-1 = 3 fd). Escala: no métrica, nominal, no dicotómica.

Variable independiente

P6.1 — solo para mujeres hasta la P6.7 (quita feminidad). Escala: métrica, intervalo, directa, no forzada, no sesgada. Codificación: 1: TD, 5: TA.

Primera corrida (stepwise)

Ver "Variables not in the analysis" en SPSS.

En este ejemplo el método paso a paso sugiere que la variable P6.7 (quita feminidad) no es relevante para clasificar a los encuestados.

Segunda corrida (introducir independientes)

Introducir las independientes juntas; quitar las no relevantes. Sacar frecuencias con el cluster en SPSS y revisar la tabla % classification results.

Resultados de clasificación

PCC: 90.5% de las observaciones fueron clasificadas correctamente (esto está abajito en letras pequeñas).
Tabla: frecuencias / porcentaje mínimo de clasificaciones correctas.
PMCC: (valid percent .00)2 + (poner los 4 de los clusters) = "sacarlo".
27.9% de los clientes se clasifican correctamente si los repartiéramos al azar en los segmentos.

Comparación:

Modelo discriminante al azar
PCC: 90.5% vs. PMCC: 27.9% — el modelo es muy bueno para clasificar, cercano al 100%.

Ecuaciones del modelo discriminante

En SPSS: tabla Canonical.

Ejemplo de función discriminante (FD1):

FD1i = (.807)·(pregunta correspondiente i) + (...)

— Poner todos los coeficientes que aparecen en esa línea.

Matriz de estructuras

FD1: escribir solo el nombre de las variables que tienen * y revisar el signo. Si tienen el mismo signo se interpreta como "y"; si tienen signo diferente, se interpreta como "vs".

Carga. Var.

Número. Pregunta

— Hacer lo mismo para todas las funciones discriminantes (FDs).

Mapa de posicionamiento

SPSS proporciona el mapa (va a ser directo).

FD1 X — eje X; FD2 Y — eje Y. Interpretar cuadrantes / grupos.

Clasificación de un caso: Montse

¿A qué clase pertenece Montse? (esto me lo da Magui y yo contesto su encuestita).

Procedimiento:

Sustituir en las ecuaciones los valores de la encuesta de las preguntas: FD1m.
Graficar a Montse y, en base a eso, sacar la conclusión final si compraría o no cerveza.
También graficar la FD3, ya que esa no estaba en el mapa.

Notas finales

Mantener todos los resultados y tablas de SPSS para la verificación. Revisar las clasificaciones erróneas y considerar la inclusión o exclusión de variables según su contribución a las funciones discriminantes.

Entradas relacionadas:

Etiquetas: