Análisis Discriminante: Clasificación y Predicción

Clasificado en Matemáticas

Escrito el en español con un tamaño de 2,92 KB

Análisis Discriminante

El análisis discriminante es un método de clasificación que asigna clases y posee dos enfoques: predictivo y descriptivo.

Enfoque Descriptivo

Analiza si existen diferencias entre los grupos en cuanto a su comportamiento con respecto a las variables consideradas y averigua en qué sentido se dan dichas diferencias. Es decir, analiza el grado de discriminación de cada variable.

Enfoque Predictivo

Elabora procedimientos de clasificación sistemática de individuos de origen desconocido en uno de los grupos existentes. Dado un individuo caracterizado por sus valores en X, el modelo discriminante determina a cuál de los K grupos pertenece.

Se construye una función D para clasificar. Sobre ella se proyecta cada punto y cada centroide, los cuales tendrán una distribución estadística. Si los grupos tienen la misma distribución, se utiliza la distancia euclidiana. De lo contrario, se usa la distancia de Mahalanobis.

Distancia de Mahalanobis

Distancia en términos de desviaciones estándar.

Número de Funciones Discriminantes

r = min(k-1, p), donde p es el número de variables (cantidad de funciones discriminantes posibles).

Función Discriminante de Fisher

Es una combinación lineal de las variables. Puede ser una recta en el plano o un plano en el espacio. D = U1X1 + U2X2 + ... + UpXp + U0, donde los U son autovectores.

Ui = (UTBU) / (UTWU)

Se requiere que las funciones estén incorrelacionadas para ser perpendiculares. El mayor autovalor corresponde a la función discriminante más importante, la cual separa a mayor distancia los grupos (discrimina bien) y recoge la mayor parte de la varianza.

Validación del Modelo

  • Lambda de Wilks: Toma valores entre 0 y 1. Hay un Lambda de Wilks para cada función discriminante. Cuanto menor sea su valor, mayor es el poder discriminante de la función.
  • Matriz de Confusión y porcentaje de aciertos: Evalúan la clasificación de los datos de validación.
  • Grado de discriminación: Depende enormemente de la diferencia entre los grupos. A mayor aislamiento, mayor eficacia del método.

Si los resultados no son satisfactorios, puede deberse a la complejidad de los grupos: distancia entre centroides, distribución de cada grupo, dispersión de los datos, etc.

Interpretación del Modelo

La interpretación se limita a evaluar la influencia (importancia) de cada variable en las funciones discriminantes, lo cual se obtiene a través de los coeficientes de cada función. A mayor coeficiente, mayor poder discriminante de la variable asociada (aunque esto no siempre es cierto, ya que la magnitud de un coeficiente está relacionada con el rango de la variable asociada).

Entradas relacionadas: