www.tlab.it
Cluster Analysis
Conjunto de técnicas estadísticas cuyo objetivo es
individuar grupos de objetos que
tengan dos características complementarias:
A - Máxima homogeneidad interna (dentro de cada
cluster);
B - Máxima heterogeneidad externa (entre cluster y
cluster).
En el lenguaje de la estadística, las características "A"
y "B" corresponden respectivamente a la varianza interna (within
cluster variance) y a la externa (between cluster variance).
En general, hay dos tipos de técnicas de Cluster
Análisis:
- Hierarchical methods
(métodos jerárquicos), cuyos algoritmos reconstruyen la jerarquía
completa de los objetos analizados (el llamado "árbol"), tanto en
orden ascendente como en orden descendente;
- Partitioning methods
(métodos divisorios), cuyos algoritmos preveen que el usuario haya
definido previamente el número de grupos en los cuales se dividen
los objetos analizados.
En T-LAB se
utilizan algoritmos de ambos tipos.
En particular:
Algunas Algunas de las publicaciones citadas en la
Bibliografía permiten profundizar tanto
los aspectos generales de los varios métodos (Bolasco S., 1999;
Lebart L., A. Morineau, M. Piron, 1995), como los aspectos
específicos relativos a el Hdbscan (Campello R. J. G. B., Moulavi
D., Zimek A. & Sander J. , 2015) y el método bisecting K-means
(Steinbach, M., G. Karypis, V. Kumar, 2000; Savaresi S.M., D.L.
Boley, 2001).
|