T-LAB Home
T-LAB 10.2 - HELP ON-LINE Prev Page Prev Page
T-LAB
Introduzione
T-LAB: cosa fa e cosa consente di fare
Requisiti e Prestazioni
Preparazione del Corpus
Preparazione del Corpus
Criteri Strutturali
Criteri Formali
File
Importare un singolo file...
Preparare un Corpus (Corpus Builder)
Aprire un Progetto Esistente
Impostazioni di Analisi
Impostazioni Automatiche e Personalizzate
Personalizzione del Dizionario
Analisi delle Co-occorrenze
Associazioni di Parole
Co-Word Analysis e Mappe Concettuali
Confronti tra Coppie
Analisi delle Sequenze e Network Analysis
Concordanze
Co-occurrence Toolkit
Analisi Tematiche
Analisi Tematica dei Contesti Elementari
Modellizazione dei Temi Emergenti
Classificazione Tematica di Documenti
Classificazione Basata su Dizionari
Testi e Discorsi come Sistemi Dinamici
Analisi Comparative
Analisi delle Specificità
Analisi delle Corrispondenze
Analisi delle Corrispondenze Multiple
Cluster Analysis
Singular Value Decomposition
Strumenti Lessico
Text Screening / Disambiguazioni
Vocabolario
Stop-Words
Locuzioni e Multi-Words
Segmentazione delle parole
Altri Strumenti
Gestione Variabili e Modalità
Ricerca Avanzata nel Corpus
Classificazione di Nuovi Documenti
Contesti Chiave di Parole Tematiche
Esportare Tabelle Personalizzate
Editor
Importare-Esportare una lista degli Identificativi
Glossario
Analisi delle Corrispondenze
Catene Markoviane
CHI quadro
Cluster Analysis
Codifica
Contesto Elementare
Corpus e Sottoinsiemi
Disambiguazione
Documento Primario
Forma e Lemma
Graph Maker
IDnumber
Indici di Associazione
Isotopia
Lemmatizzazione
Lessia e Lessicalizzazione
MDS
Multiwords
N-grammi
Naïve Bayes
Normalizzazione del Corpus
Nuclei Tematici
Occorrenze e Co-occorrenze
Omografia
Parole Chiave
Polarità fattoriali
Profilo
Soglia di Frequenza
Specificità
Stop Word List
Tabelle Dati
TF-IDF
Unità di Analisi
Unità di Contesto
Unità Lessicale
Valore Test
Variabili e Modalità
Bibliografia
www.tlab.it

Co-Word Analysis e Mappe Concettuali


N.B.: Le immagini di questa sezione fanno riferimento a una versione precedente di T-LAB. In T-LAB 10 l'aspetto è leggermente diverso. Inoltre: a) quando è attiva l'opzione 'selezione automatica delle parole chiave', nella mappa MDS vengono usati differenti colori per distinguere i vari gruppi (cluster) di elementi; b) è stata aggiunta una tecnica di visualizzazione denominata t-SNE (t-Distributed Stochastic Neighbor Embedding); c) un nuovo strumento (Graph Maker) consente di creare ed esportare vari tipi di grafici dinamici in formato HTML; d) il tasto destro sulle tabelle con le parole chiave rende disponibili opzioni supplementari; e) una galleria di immagini funziona come un menu aggiuntivo e consente di passare da un output all'altro con un solo clic.
Alcune di queste nuove funzionalità sono evidenziate nell'immagine seguente.

L'uso di questa funzione T-LAB consente di realizzare due tipi di analisi concernenti le co-occorrenze delle parole:

A - tra singole parole-chiave (lemmi o categorie), se la loro quantità non supera 500 elementi (min 10);
B - tra (ed entro) piccoli cluster, denominati Nuclei Tematici, se la quantità delle parole-chiave selezionate supera 100 elementi (max 3000).


L'utilizzatore può selezionare l'indice di associazione da utilizzare e, solo nel caso dell'opzione (B), sia la quantità massima di cluster da ottenere (da 50 a 100) che la quantità massima di parole-chiave per cluster.

La procedura di calcolo utilizzata prevede i seguenti passi:

1- costruzione di una matrice delle co-occorrenze (relazioni tra parole);
2- calcolo degli indici di associazione selezionati (Coseno, Dice, Jaccard, Equivalenza, Inclusione, Informazione Mutua);
3- clusterizzazione gerarchica applicata alla matrice delle dissimilarità;
4- costruzione di una seconda matrice delle dissimilarità (relazioni tra cluster);

5- rappresentazione grafica mediante multidimensional scaling e analisi delle corrispondenze.

N.B.:
- nei casi "A" (vedi sopra), l'utilizzatore può rivedere e personalizzare la selezione delle parole-chiave (vedi immagine seguente) e T-LAB non effettua i passaggi 3 e 4;


- un'accurata selezione delle parole-chiave, garantisce una migliore qualità dei risultati;
- poiché le parole multiple non classificate da T-LAB sono casi specifici di co-occorrenza e l'opzione "B" li individua come cluster (ad esempio, "Torri" + "Gemelle"), si consiglia di risolvere questi casi durante la fase di importazione del corpus. In ogni caso, senza ripetere il processo di importazione, è possibile effettuare gli opportuni interventi tramite la funzione Personalizzazione del Dizionario (ad esempio, attribuendo la label "Torri_Gemelle" ai due distinti item "Torri" e "Gemelle");
- le tabelle utilizzate per le rappresentazioni grafiche possono essere esplorate e salvate con qualche click (vedi immagine seguente).


Al termine dell'analisi automatica, i grafici prodotti da T-LAB sono di quattro tipi (vedi sotto), e ciascuno di essi può essere personalizzato tramite la corrispondente finestra di dialogo (tasto destro del mouse).

1 - Mappa MDS

2 - Analisi Fattoriale delle Corrispondenze

3 - Diagramma delle Associazioni

4 - Diagramma con le misure di Centralità e Densità (solo nel caso della cluster analisi)

In particolare, i risultati ottenuti mediante Analisi Fattoriale delle Corrispondenze possono essere esplorati attraverso grafici che utilizzano le coordinate sui primi dieci assi fattori (vedi sotto "A").
Poiché T-LAB consente di verificare i Valori Test di ogni fattore (vedi sotto "B"), questo tipo di output può essere utilizzato per un'accurata interpretazione delle relazioni tra cluster e/o tra parole-chiave.

L'esplorazione e/o la personalizzazione dei vari grafici è consentita nei modi seguenti:

AZIONE
RISULTATO
click su un item della tabella o su un punto del grafico
grafico delle relative associazioni
click su una label della colonna "CLUSTER" (vedi sotto "A")
lista con gli elementi del cluster
click sul pulsante "cambia label" (vedi sotto "B")
nuova label attribuita al cluster
click sul pulsante "passi dell'aggregazione" (vedi sotto "C")
file HTML con le aggregazioni nel cluster selezionato
tasto destro del mouse
personalizzazione dei grafici

 

Una ulteriore finestra T-LAB (vedi immagine seguente, step 1) consente di creare file grafici che possono essere editati con software per la network analysis quali Gephi, Pajek, Ucinet, yEd ed altri. In questo caso, le opzioni disponibili sono le seguenti: selezionare gli item (cioè i nodi) da inserire nei grafici (vedi sotto, step 2 e 3), esportare la corrispondente matrice di adiacenza (vedi sotto, step 4), esportare il tipo di file prescelto (vedi sotto, step 5).

N.B.: In T-LAB 10 la finestra seguente è stata sostituita con lo strumento Graph Maker.

Ad esempio, un file .gml esportato da T-LAB può consentire di realizzare un grafico come il seguente.

Le tabelle esportabili con questo strumento T-LAB sono di tre tipi:

1 - La tabella "Cluster Membership" (vedi sotto) riporta la storia dell'aggregazione gerarchica interna a ciascun cluster;

2 - La tabella "Sommario" (vedi sotto) include le seguenti misure:

- ECQ = quantità dei contesti elementari in cui due o più elementi del cluster sono co-occorrenti;
- Centrality = media degli indici di associazione concernenti le relazioni tra cluster;
- Density = media degli indici di associazioni interni a ciascun cluster.

3 - La tabella "Indici di Associazione" (vedi sotto) riporta le misure delle relazioni di somiglianza tra i cluster (between) e tra le parole interne a ciascun cluster (within).

Between
Within

 

N.B.:
- nel caso in cui non sia stata effettuata una Cluster Analysis, la tabella "Cluster Membership" non è ovviamente disponibile, la tabella "Sommario" è semplificata e quella con gli "Indici di Associazione" si riferisce alle relazioni di co-occorrenza tra le parole;
- a
ll'uscita da questa analisi, il dizionario dei Nuclei Tematici (cioè la lista delle label attribuite ai cluster di parole) può essere esportato e, dopo un'attenta revisione, può essere importato tramite la funzione Personalizzazione del Dizionario. In questo modo, l'utilizzatore potrà realizzare analisi di secondo livello e passare dalle parole (primo livello) ai "temi" o ai "concetti".