www.tlab.it
Impostazioni Automatiche e
Personalizzate
La scelta delle impostazioni automatiche (A) o personalizzate (B) riguarda la lista delle
Parole Chiave utilizzate in tutte
analisi effettuate con T-LAB.
Tale scelta è reversibile fino a quando l'utilizzatore non effettua
interventi che modificano il Dizionario
del corpus.
A) IMPOSTAZIONI AUTOMATICHE
La scelta delle impostazioni
automatiche comporta che la lista delle parole chiave
includa fino a un massimo di 5000 unità
lessicali selezionate automaticamente da T-LAB e appartenenti alle categorie
grammaticali che sono più dense di significato: nomi, verbi,
aggettivi e avverbi.
Il criterio di selezione utilizzato da T-LAB varia in funzione del tipo di corpus in
analisi.
Se il corpus è costituito da un unico testo, le unità
lessicali selezionate sono semplicemente quelle con i più elevati
valori di occorrenza.
Se il corpus è costituito da due o più testi
T-LAB applica il seguente
algoritmo:
a) seleziona le parole con valori di occorrenza superiori
alla soglia minima;
b) calcola i valori del TF-IDF o
applica il test del CHI quadro a tutti gli
incroci di ogni parola selezionata per tutti i testi in analisi
(N.B.: Nel caso del CHI quadro, il numero massimo dei testi è
500);
c) seleziona le parole con i valori maggiori nel metodo
utilizzato (TF-IDF o CHI quadro), ovvero seleziona quelle parole
che, nel corpus, fanno la differenza.
N.B.:
- Nel caso il corpus sia costituito da due o più testi,
l'utilizzatore può scegliere il criterio di selezione (CHI quadro o
TF-IDF) nella fase di importazione (vedi immagine seguente).
- Quando è attiva l'opzione di impostazioni automatiche la tabella con la lista
delle Parole Chiave include una
colonna 'T-LAB' che indica la rilevanza di ogni item secondo il
criterio selezionato (vedi immagine seguente).
B) IMPOSTAZIONI PERSONALIZZATE
La scelta delle impostazioni
personalizzate consente all'utilizzatore di selezionare, ridenominare e raggruppare le unità
lessicali (parole, lemmi o categorie) da includere nelle
successive analisi T-LAB.
Nella tabella di riferimento è riportata la lista
(lista 1) delle unità lessicali con valori di occorrenza uguali o
superiori alla soglia prefissata.
Alcune di queste, quelle marcate con un segno "v", fanno
parte di una sub-lista (lista 2) creata da T-LAB
(vedi impostazioni
automatiche).
In funzione delle analisi che intende effettuare,
l'utilizzatore può decidere se usare/modificare la lista (1) o la
lista (2).
In entrambi i casi le operazioni possibili sono le
seguenti:
- modificare il valore di
soglia;
- selezionare i lemmi da
mettere fuori analisi;
- ripristinare l'uso di uno o
più lemmi;
- selezionare/deselezionare
gli item da utilizzare.
Un click su uno dei pulsanti "(1)" o "(2)" abilita
l'opzione personalizzata delle impostazioni di analisi (vedi
immagine seguente).
Le opzioni che riguardano gli interventi sui singoli lemmi sono accessibili
tramite il tasto destro del mouse selezionando un qualunque item
della tabella .
La ridenominazione di un singolo
lemma va effettuata nel modo seguente:
1- accertarsi che sia attiva l'opzione "RINOMINARE";
2- cliccare su un item della lista;
3- scegliere una delle parole o digitare una label a propria
scelta;
4- cliccare su "RINOMINA".
I raggruppamenti di due o più lemmi vanno effettuate
nel modo seguente:
1- selezionare la modalità "RAGGRUPPARE";
2- cliccare su due o più item della lista;
3- scegliere uno dei lemmi o digitare una label a propria
scelta;
4- cliccare su "RINOMINA".
Ulteriori opzioni sono
attivabili usando il tasto destro nel
box con gli item da rinominare/raggruppare (A) o nel box con i
'lemmi eliminati' (B).
In particolare, quando - nel caso (A) - viene
selezionata l'opzione 'Key-Word-in-Context', è possibile accedere
automaticamente allo strumento Concordanze e verificare i contesti di
occorrenza dei vari item (vedi immagine seguente).
Uno specifico pulsante (vedi sotto) consente di
importare liste personalizzate di parole
chiave.
Ogni lista da importare (file MyList.diz) può includere fino a
10.000 records (min 20). Ogni record (o riga) della lista deve
essere costituito da una parola (Max 50 caratteri) e non deve
contenere né spazi vuoti né segni di punteggiatura.
Un modello di file MyList.diz viene creato automaticamente da
T-LAB
ogni volta che viene salvata una lista delle parole chiave (si veda
l'apposito pulsante in basso a sinistra).
Le impostazioni di analisi, ovvero sia la selezione dei
lemmi (o categorie) che il dizionario in uso, possono essere
salvate e ripristinate usando gli appositi pulsanti ( Archiviare o
Ripristinare). Ciò significa che lo stesso
corpus - senza bisogno di ulteriori importazioni - può essere
analizzato con vari dizionari e con diverse selezioni delle parole
chiave. Ciò fino a un massimo di 10 diverse
impostazioni.
In T-LAB,
inoltre, è previsto che le impostazioni possono essere riviste in
più sessioni, anche con vari utilizzi della funzione Personalizzazione del Dizionario.
|