Métodos de Conglomeración: Jerárquicos y No Jerárquicos
Clasificado en Otras materias
Escrito el en español con un tamaño de 2,3 KB
Métodos de Conglomeración
Medidas de Distancia y Asociación
Para agrupar datos en conglomerados, se utilizan medidas de distancia y asociación:
- Distancia Bloque: Diferencia promedio de las dimensiones.
- Distancia Chebychev: Diferencia máxima en cualquiera de las dimensiones.
Las medidas de asociación representan la similitud entre entidades con datos no métricos (nominales u ordinales). Estas medidas determinan el grado de acuerdo o desacuerdo entre entidades.
Métodos de Conglomeración
Los métodos de conglomeración agrupan puntos cercanos basándose en su similitud. Existen dos tipos:
Métodos Jerárquicos
Implican la extracción de conglomerados en pasos sucesivos. Hay dos enfoques:
- Aglomerativo (ascendente): Se comienza considerando cada entidad como un conglomerado separado. En cada paso, se unen entidades hasta formar un único conglomerado.
- Disociativo (descendente): Se comienza con un gran conglomerado y se separan las entidades menos similares en cada paso hasta que cada una forma un conglomerado individual.
Existen cinco métodos para formar conglomerados jerárquicos:
- Unión Simple (Vecino más próximo): Une las dos entidades con la menor distancia.
- Unión Completa (Vecino más lejano): Se basa en la distancia máxima entre entidades de un conglomerado.
- Unión Promedio (Vinculación inter-grupos): Se basa en la distancia media entre todas las entidades de dos conglomerados.
- Método de Ward: La distancia entre dos conglomerados es la suma de los cuadrados de las diferencias para todas las variables.
- Método del Centroide: La distancia entre dos conglomerados es la distancia entre sus centroides.
Métodos No Jerárquicos
Los métodos no jerárquicos asignan entidades a un número predefinido de conglomerados. Se asignan las entidades que se encuentran dentro de una distancia dada del núcleo del conglomerado.
Es recomendable utilizar ambos métodos, utilizando los centroides obtenidos por el método jerárquico como núcleos para el método no jerárquico.