www.tlab.it
Cluster Analysis
N.B.: Le immagini di questa sezione fanno riferimento a una
versione precedente di T-LAB.
In T-LAB 10 l'aspetto è
leggermente diverso. Inoltre: a) un nuovo pulsante (Tree Map Preview) consente di creare grafici
dinamici in formato HTML; b) il pulsante 'dendrogramma' è stato
sostituito con lo strumento Graph
Maker.
L'opzione Cluster Analysis attiva una procedura di
calcolo (vedi nota a fondo pagina) che utilizza i risultati di una
precedente Analisi delle Corrispondenze;
in particolare utilizza le coordinate degli oggetti (a seconda dei
casi, unità lessicali o unità di contesto) sui primi assi
fattoriali (fino a un massimo di 10).
A seconda dei casi, l'utilizzatore
può scegliere tra tre tecniche di clusterizzazione:
a) gerarchica (metodo
Ward);
b) K-means (metodo MacQueen);
c) hdbscan (hierarchical DBSCAN).
Le prime due (a, b) consentono di
esplorare (tabelle e grafici) soluzioni da 3 a 20 cluster; mentre
la terza (c), che richiede un parametro aggiuntivo (ovvero il
numero minimo di parole all'interno di un cluster), consente
all'utente di esplorare solo una soluzione.
N.B.: Quando viene selezionato il
metodo gerarchico T-LAB abilita
un'opzione (vedi pulsante 'RAFFINA') che consente di combinare i
metodi Ward e K-Means.
Una breve descrizione delle tre
tecniche è contenuta nel glossario di
questo manuale.
Al termine dell'elaborazione T-LAB rende disponibili grafici e
tabelle.
Alcuni grafici rappresentano i cluster nello stesso
spazio individuato tramite l'analisi delle corrispondenze (vedi
sotto).
N.B.: Per esplorare le varie combinazioni degli
assi fattoriali è sufficiente selezionarli negli appositi box
("Asse X", "Asse Y").
Nel caso della clusterizzazione
gerarchica, l'utilizzatore può agevolmente esplorare
(grafici e tabelle) le diverse partizioni.
Dendrogrammi, grafici a torta e istogrammi
consentono di verificare le caratteristiche di ogni
partizione.
Alcuni istogrammi consentono
di verificare le relazioni tra cluster e modalità delle
variabili.
Le tabelle sono di due tipi:
(A) se gli
oggetti clusterizzati sono le unità lessicali, per ciascuna di esse
(e per ogni cluster) vengono riportate le relative occorrenze
('OCC') e le loro distanze ('DIST') dal centroide; inoltre per le
variabili che in modo significativo risultano associate al cluster
in esame vengono mostrati i relativi Valori
Test .
(B) se gli
oggetti clusterizzati sono i contesti elementari, le
caratteristiche di ogni cluster (unità lessicali e variabili) sono
descritte con lo stesso metodo usato nella funzione
Analisi Tematica dei Contesti
Elementari.
Nel caso di analisi realizzate con metodi
gerarchici o K-means T-LAB consente di visualizzare ed esportare un
file (vedi pulsante "Output HTML") in cui sono riportate le
caratteristiche dei cluster e alcune misure concernenti la qualità
della partizione in esame.
Nel caso delle mappe di Kohonen, T-LAB produce un
solo tipo di output: un file HTML con la griglia dei neuroni e le
unità lessicali incluse in ciascuno di essi.
|