T-LAB Home
T-LAB 10.2 - HELP ON-LINE Prev Page Prev Page
T-LAB
Introduzione
T-LAB: cosa fa e cosa consente di fare
Requisiti e Prestazioni
Preparazione del Corpus
Preparazione del Corpus
Criteri Strutturali
Criteri Formali
File
Importare un singolo file...
Preparare un Corpus (Corpus Builder)
Aprire un Progetto Esistente
Impostazioni di Analisi
Impostazioni Automatiche e Personalizzate
Personalizzione del Dizionario
Analisi delle Co-occorrenze
Associazioni di Parole
Co-Word Analysis e Mappe Concettuali
Confronti tra Coppie
Analisi delle Sequenze e Network Analysis
Concordanze
Co-occurrence Toolkit
Analisi Tematiche
Analisi Tematica dei Contesti Elementari
Modellizazione dei Temi Emergenti
Classificazione Tematica di Documenti
Classificazione Basata su Dizionari
Testi e Discorsi come Sistemi Dinamici
Analisi Comparative
Analisi delle Specificità
Analisi delle Corrispondenze
Analisi delle Corrispondenze Multiple
Cluster Analysis
Singular Value Decomposition
Strumenti Lessico
Text Screening / Disambiguazioni
Vocabolario
Stop-Words
Locuzioni e Multi-Words
Segmentazione delle parole
Altri Strumenti
Gestione Variabili e Modalità
Ricerca Avanzata nel Corpus
Classificazione di Nuovi Documenti
Contesti Chiave di Parole Tematiche
Esportare Tabelle Personalizzate
Editor
Importare-Esportare una lista degli Identificativi
Glossario
Analisi delle Corrispondenze
Catene Markoviane
CHI quadro
Cluster Analysis
Codifica
Contesto Elementare
Corpus e Sottoinsiemi
Disambiguazione
Documento Primario
Forma e Lemma
Graph Maker
IDnumber
Indici di Associazione
Isotopia
Lemmatizzazione
Lessia e Lessicalizzazione
MDS
Multiwords
N-grammi
Naïve Bayes
Normalizzazione del Corpus
Nuclei Tematici
Occorrenze e Co-occorrenze
Omografia
Parole Chiave
Polarità fattoriali
Profilo
Soglia di Frequenza
Specificità
Stop Word List
Tabelle Dati
TF-IDF
Unità di Analisi
Unità di Contesto
Unità Lessicale
Valore Test
Variabili e Modalità
Bibliografia
www.tlab.it

Cluster Analysis


N.B.: Le immagini di questa sezione fanno riferimento a una versione precedente di T-LAB. In T-LAB 10 l'aspetto è leggermente diverso. Inoltre: a) un nuovo pulsante (Tree Map Preview) consente di creare grafici dinamici in formato HTML; b) il pulsante 'dendrogramma' è stato sostituito con lo strumento Graph Maker.

L'opzione Cluster Analysis attiva una procedura di calcolo (vedi nota a fondo pagina) che utilizza i risultati di una precedente Analisi delle Corrispondenze; in particolare utilizza le coordinate degli oggetti (a seconda dei casi, unità lessicali o unità di contesto) sui primi assi fattoriali (fino a un massimo di 10).

A seconda dei casi, l'utilizzatore può scegliere tra tre tecniche di clusterizzazione:

a) gerarchica (metodo Ward);
b) K-means (metodo MacQueen);
c) hdbscan (hierarchical DBSCAN).

Le prime due (a, b) consentono di esplorare (tabelle e grafici) soluzioni da 3 a 20 cluster; mentre la terza (c), che richiede un parametro aggiuntivo (ovvero il numero minimo di parole all'interno di un cluster), consente all'utente di esplorare solo una soluzione.

N.B.: Quando viene selezionato il metodo gerarchico T-LAB abilita un'opzione (vedi pulsante 'RAFFINA') che consente di combinare i metodi Ward e K-Means.

Una breve descrizione delle tre tecniche è contenuta nel glossario di questo manuale.

Al termine dell'elaborazione T-LAB rende disponibili grafici e tabelle.

Alcuni grafici rappresentano i cluster nello stesso spazio individuato tramite l'analisi delle corrispondenze (vedi sotto).

N.B.: Per esplorare le varie combinazioni degli assi fattoriali è sufficiente selezionarli negli appositi box ("Asse X", "Asse Y").

Nel caso della clusterizzazione gerarchica, l'utilizzatore può agevolmente esplorare (grafici e tabelle) le diverse partizioni.

Dendrogrammi, grafici a torta e istogrammi consentono di verificare le caratteristiche di ogni partizione.

Alcuni istogrammi consentono di verificare le relazioni tra cluster e modalità delle variabili.

Le tabelle sono di due tipi:

(A) se gli oggetti clusterizzati sono le unità lessicali, per ciascuna di esse (e per ogni cluster) vengono riportate le relative occorrenze ('OCC') e le loro distanze ('DIST') dal centroide; inoltre per le variabili che in modo significativo risultano associate al cluster in esame vengono mostrati i relativi Valori Test .


 

(B) se gli oggetti clusterizzati sono i contesti elementari, le caratteristiche di ogni cluster (unità lessicali e variabili) sono descritte con lo stesso metodo usato nella funzione Analisi Tematica dei Contesti Elementari.

Nel caso di analisi realizzate con metodi gerarchici o K-means T-LAB consente di visualizzare ed esportare un file (vedi pulsante "Output HTML") in cui sono riportate le caratteristiche dei cluster e alcune misure concernenti la qualità della partizione in esame.

Nel caso delle mappe di Kohonen, T-LAB produce un solo tipo di output: un file HTML con la griglia dei neuroni e le unità lessicali incluse in ciascuno di essi.