www.tlab.it
Co-Word Analysis e Mappe
Concettuali
N.B.: Le immagini di questa sezione fanno riferimento a una
versione precedente di T-LAB.
In T-LAB 10 l'aspetto è
leggermente diverso. Inoltre: a) quando è attiva l'opzione
'selezione automatica delle parole chiave', nella mappa
MDS vengono usati differenti colori
per distinguere i vari gruppi (cluster) di elementi; b) è stata
aggiunta una tecnica di visualizzazione denominata t-SNE
(t-Distributed Stochastic Neighbor Embedding); c) un nuovo
strumento (Graph Maker) consente di creare
ed esportare vari tipi di grafici dinamici in formato HTML; d) il
tasto destro sulle tabelle con le
parole chiave rende disponibili opzioni supplementari; e) una
galleria di immagini funziona come un menu aggiuntivo e consente di
passare da un output all'altro con un solo clic.
Alcune di queste nuove funzionalità sono evidenziate nell'immagine
seguente.
L'uso di questa funzione T-LAB consente di realizzare due tipi di
analisi concernenti le co-occorrenze
delle parole:
A - tra singole parole-chiave (lemmi o categorie), se la
loro quantità non supera 500 elementi (min 10);
B - tra (ed entro) piccoli cluster, denominati
Nuclei Tematici, se la quantità delle
parole-chiave selezionate supera 100
elementi (max 3000).
L'utilizzatore può selezionare l'indice di associazione da utilizzare e, solo nel
caso dell'opzione (B), sia la quantità massima di cluster da
ottenere (da 50 a 100) che la quantità massima di parole-chiave per
cluster.
La procedura di calcolo utilizzata
prevede i seguenti passi:
1-
costruzione di una matrice delle co-occorrenze (relazioni tra
parole);
2- calcolo degli indici di associazione selezionati (Coseno, Dice,
Jaccard, Equivalenza, Inclusione,
Informazione Mutua); 3-
clusterizzazione gerarchica applicata alla
matrice delle dissimilarità;
4- costruzione di una seconda matrice delle dissimilarità
(relazioni tra cluster);
5- rappresentazione grafica mediante multidimensional scaling e
analisi delle
corrispondenze.
N.B.:
- nei casi "A" (vedi sopra), l'utilizzatore può rivedere e
personalizzare la selezione delle parole-chiave (vedi immagine
seguente) e T-LAB non effettua
i passaggi 3 e 4;
- un'accurata selezione delle
parole-chiave, garantisce una migliore qualità dei
risultati;
- poiché le parole multiple non
classificate da T-LAB sono casi
specifici di co-occorrenza e l'opzione "B" li individua come
cluster (ad esempio, "Torri" + "Gemelle"), si consiglia di
risolvere questi casi durante la fase di importazione del corpus. In ogni caso, senza
ripetere il processo di importazione, è possibile effettuare gli
opportuni interventi tramite la funzione Personalizzazione del Dizionario (ad esempio,
attribuendo la label "Torri_Gemelle" ai due distinti item "Torri" e
"Gemelle");
- le tabelle utilizzate per le rappresentazioni grafiche possono
essere esplorate e salvate con qualche click (vedi immagine
seguente).
Al termine dell'analisi automatica, i grafici
prodotti da T-LAB sono di quattro tipi (vedi sotto),
e ciascuno di essi può essere personalizzato tramite la
corrispondente finestra di dialogo (tasto destro del mouse).
1 - Mappa MDS
2 - Analisi Fattoriale delle Corrispondenze
3 - Diagramma delle Associazioni
4 - Diagramma con le misure di Centralità e
Densità (solo nel caso della cluster analisi)
In particolare, i risultati ottenuti mediante
Analisi Fattoriale delle
Corrispondenze possono essere esplorati attraverso grafici
che utilizzano le coordinate sui primi dieci assi fattori (vedi
sotto "A").
Poiché T-LAB consente di verificare i Valori Test di ogni
fattore (vedi sotto "B"), questo tipo di output può essere
utilizzato per un'accurata interpretazione delle relazioni tra
cluster e/o tra parole-chiave.
L'esplorazione e/o la personalizzazione dei vari
grafici è consentita nei modi seguenti:
AZIONE
|
RISULTATO
|
click su un item della tabella o su un punto
del grafico
|
grafico delle relative associazioni
|
click su una label della colonna "CLUSTER"
(vedi sotto "A")
|
lista con gli elementi del cluster
|
click sul pulsante "cambia label" (vedi sotto
"B")
|
nuova label attribuita al cluster
|
click sul pulsante "passi dell'aggregazione"
(vedi sotto "C")
|
file HTML con le aggregazioni nel cluster
selezionato
|
tasto destro del mouse
|
personalizzazione dei grafici
|
Una ulteriore finestra T-LAB (vedi immagine seguente, step 1)
consente di creare file grafici che possono essere editati con
software per la network analysis quali
Gephi, Pajek, Ucinet, yEd ed altri. In questo caso, le opzioni
disponibili sono le seguenti: selezionare gli item (cioè i
nodi) da inserire nei grafici (vedi
sotto, step 2 e 3), esportare la corrispondente matrice di
adiacenza (vedi sotto, step 4), esportare il tipo di file prescelto
(vedi sotto, step 5).
N.B.: In T-LAB 10 la
finestra seguente è stata sostituita con lo strumento Graph Maker.
Ad esempio, un file .gml esportato da
T-LAB può consentire di realizzare un grafico
come il seguente.
Le tabelle esportabili con questo strumento
T-LAB sono di tre tipi:
1 - La tabella "Cluster Membership" (vedi sotto)
riporta la storia dell'aggregazione gerarchica interna a ciascun
cluster;
2 - La tabella "Sommario" (vedi sotto)
include le seguenti misure:
- ECQ = quantità dei contesti elementari in cui due
o più elementi del cluster sono co-occorrenti;
- Centrality = media degli indici di associazione concernenti le
relazioni tra cluster;
- Density = media degli indici di associazioni interni a ciascun
cluster.
3 - La tabella "Indici di Associazione"
(vedi sotto) riporta le misure delle relazioni di somiglianza tra i
cluster (between) e tra le parole interne a ciascun cluster
(within).
Between
|
Within
|
|
|
N.B.:
- nel caso in cui non sia stata effettuata una Cluster Analysis, la
tabella "Cluster Membership" non è ovviamente disponibile, la
tabella "Sommario" è semplificata e quella con gli "Indici di
Associazione" si riferisce alle relazioni di co-occorrenza tra le
parole;
- all'uscita da questa analisi, il dizionario dei Nuclei
Tematici (cioè la lista delle label attribuite ai cluster di
parole) può essere esportato e, dopo un'attenta revisione, può
essere importato tramite la funzione Personalizzazione del Dizionario. In questo
modo, l'utilizzatore potrà realizzare analisi di secondo livello e
passare dalle parole (primo livello) ai "temi" o ai
"concetti".
|