T-LAB Home
T-LAB PLUS 2019 - HELP ON-LINE Prev Page Prev Page
T-LAB
Introduzione
T-LAB: cosa fa e cosa consente di fare
Requisiti e Prestazioni
Preparazione del Corpus
Preparazione del Corpus
Criteri Strutturali
Criteri Formali
File
Importare un singolo file...
Preparare un Corpus (Corpus Builder)
Aprire un Progetto Esistente
Impostazioni di Analisi
Impostazioni Automatiche e Personalizzate
Personalizzione del Dizionario
Analisi delle Co-occorrenze
Associazioni di Parole
Co-Word Analysis e Mappe Concettuali
Confronti tra Coppie
Analisi delle Sequenze e Network Analysis
Concordanze
Analisi Tematiche
Analisi Tematica dei Contesti Elementari
Modellizazione dei Temi Emergenti
Classificazione Tematica di Documenti
Classificazione Basata su Dizionari
Contesti Chiave di Parole Tematiche
Analisi Comparative
Analisi delle Specificità
Analisi delle Corrispondenze
Analisi delle Corrispondenze Multiple
Cluster Analysis
Singular Value Decomposition
Strumenti Lessico
Text Screening / Disambiguazioni
Vocabolario
Stop-Words
Locuzioni e Multi-Words
Segmentazione delle parole
Altri Strumenti
Gestione Variabili e Modalità
Ricerca Avanzata nel Corpus
Tabelle di Contingenza
Editor
Glossario
Analisi delle Corrispondenze
Catene Markoviane
CHI quadro
Cluster Analysis
Codifica
Contesto Elementare
Corpus e Sottoinsiemi
Disambiguazione
Documento Primario
Forma e Lemma
Graph Maker
IDnumber
Indici di Associazione
Isotopia
Lemmatizzazione
Lessia e Lessicalizzazione
MDS
Multiwords
N-grammi
Naïve Bayes
Normalizzazione del Corpus
Nuclei Tematici
Occorrenze e Co-occorrenze
Omografia
Parole Chiave
Polarità fattoriali
Profilo
Soglia di Frequenza
Specificità
Stop Word List
Tabelle Dati
TF-IDF
Unità di Analisi
Unità di Contesto
Unità Lessicale
Valore Test
Variabili e Modalità
Bibliografia
www.tlab.it

Cluster Analysis


N.B.: Le immagini di questa sezione fanno riferimento all'interfaccia di T-LAB 9. In T-LAB Plus l'aspetto è leggermente diverso. Inoltre: a) un nuovo pulsante (Tree Map Preview) consente di creare grafici dinamici in formato HTML; b) il pulsante 'dendrogramma' è stato sostituito con lo strumento Graph Maker.

L'opzione Cluster Analysis attiva una procedura di calcolo (vedi nota a fondo pagina) che utilizza i risultati di una precedente Analisi delle Corrispondenze; in particolare utilizza le coordinate degli oggetti (a seconda dei casi, unità lessicali o unità di contesto) sui primi assi fattoriali (fino a un massimo di 10).

A seconda dei casi, l'utilizzatore può scegliere tra tre tecniche di clusterizzazione:

a) gerarchica (metodo Ward);
b) K-means (metodo MacQueen);
c) Kohonen (griglia di neuroni).

Le prime due (a, b) consentono di esplorare (tabelle e grafici) soluzioni da 3 a 20 cluster; mentre la terza (c), raggruppa le unità di analisi (solo se unità lessicali) entro griglie di dimensioni variabili (min 3 x 3, max 9 x 9).

N.B.: Quando viene selezionato il metodo gerarchico T-LAB abilita un'opzione (vedi pulsante 'RAFFINA') che consente di combinare i metodi Ward e K-Means.

Una breve descrizione delle tre tecniche è contenuta nel glossario di questo manuale.

Al termine dell'elaborazione T-LAB rende disponibili grafici e tabelle.

Alcuni grafici rappresentano i cluster nello stesso spazio individuato tramite l'analisi delle corrispondenze (vedi sotto).

N.B.: Per esplorare le varie combinazioni degli assi fattoriali è sufficiente selezionarli negli appositi box ("Asse X", "Asse Y").

Nel caso della clusterizzazione gerarchica, l'utilizzatore può agevolmente esplorare (grafici e tabelle) le diverse partizioni.

Dendrogrammi, grafici a torta e istogrammi consentono di verificare le caratteristiche di ogni partizione.

Alcuni istogrammi consentono di verificare le relazioni tra cluster e modalità delle variabili.

Le tabelle sono di due tipi:

(A) se gli oggetti clusterizzati sono le unità lessicali, per ciascuna di esse (e per ogni cluster) vengono riportate le relative occorrenze ('OCC') e le loro distanze ('DIST') dal centroide; inoltre per le variabili che in modo significativo risultano associate al cluster in esame vengono mostrati i relativi Valori Test .


 

(B) se gli oggetti clusterizzati sono i contesti elementari, le caratteristiche di ogni cluster (unità lessicali e variabili) sono descritte con lo stesso metodo usato nella funzione Analisi Tematica dei Contesti Elementari.

Nel caso di analisi realizzate con metodi gerarchici o K-means T-LAB consente di visualizzare ed esportare un file (vedi pulsante "Output HTML") in cui sono riportate le caratteristiche dei cluster e alcune misure concernenti la qualità della partizione in esame.

Nel caso delle mappe di Kohonen, T-LAB produce un solo tipo di output: un file HTML con la griglia dei neuroni e le unità lessicali incluse in ciascuno di essi.