www.tlab.it
Personalizzazione del
Dizionario
L'opzione Personalizzazione
del Dizionario apre una finestra per eventuali interventi
sul dizionario del corpus.
L'utilizzatore può ridenominare o raggruppare i
lemmi disponibili (vedi sotto opzione '3'); ; inoltre può esportare
il dizionario costruito (vedi sotto opzione '4') o importare un
dizionario personalizzato (vedi sotto
opzione '5').
Il punto di partenza è costituito da una tabella
(il Dizionario del Corpus) che riporta
le seguenti informazioni:
- corrispondenze forma/lemma;
- occorrenze di ogni forma nel corpus;
- alcune etichette che si riferiscono alla lemmatizzazione automatica (colonna
"INF").
Prima di ogni intervento, selezionando una
specifica forma e usando il tasto destro del mouse, è possibile
verificare le concordanze
(Key-Word-in-Context) che interessano (vedi sopra
opzione'2').
In ogni caso, prima di ogni intervento, dopo aver
cliccato il tab selezione delle parole
chiave, devono essere attivate le impostazioni
personalizzate (vedi sopra opzione '1').
Gli interventi
possibili, pur se diversi nelle loro intenzionalità
(revisione delle lemmatizzazioni e/o applicazioni di griglie per
l'analisi del contenuto), si traducono tutti in una
riorganizzazione del database T-LAB e quindi in diverse
tabelle per l'analisi dei dati.
Ne deriva che tutti gli interventi vanno effettuati sulle forme
(lemmi o categorie) ritenute interessanti ai fini delle analisi
successive. T-LAB,
infatti, rende disponibile un'ulteriore funzione - Impostazioni Personalizzate (vedi Impostazioni Personalizzate) - attraverso la quale
gli utilizzatori possono decidere quali lemmi "tenere" e quali
"mettere fuori".
Le due funzioni (Personalizzazione
del Dizionario e Impostazioni Personalizzate) sono molto integrate tra loro e l'utente può agevolmente
muoversi dall'una all'altra, anche per cambiare le proprie
scelte.
In Personalizzazione del
Dizionario, per cambiare le label (o 'lemmi') attribuite
alle parole, sono previste due modalità di
intervento:
- una del tipo "uno-per-uno" con modifiche dirette
sulla colonna "LEMMA" (selezionare e digitare);
- una che consente di spostare le selezioni sul box
a destra (click su un qualunque item) e, successivamente, di
ridenominarle attraverso l'uso dell'opzione "rinomina". (N.B.: In
questo caso, la nuova label può essere
definita utilizzando uno dei lemmi selezionati o digitando nel box
"nuova label"; vedi sopra opzione '3');
- una che prevede l'importazione di un dizionario
personalizzato, riservata agli utilizzatori esperti che dispongono
di loro liste per classificare le parole presenti in uno o più
corpus (vedi sopra opzione
'5').
N.B.: L'uso del tasto
destro nel box Rinominare/Raggruppare abilita un menu
contestuale che consente tre operazioni: a) verificare le
concordanze (KeyWord-in-Context) dell'item selezionato; b)
rimuovere l'item selezionato dal box; c) rimuovere tutti gli item
selezionati dal box.
Per l'importazione di un dizionario personalizzato si
richiede che l'utilizzatore abbia predisposto un file Dictio.diz o un file
Dictionary.diz, i quali possono
essere costituiti da "n" righe, ciascuna con una coppia di stringhe
separate dal carattere ";" .
In entrambi i casi, la lunghezza massima di ogni stringa (parola,
lemma o categoria) è di 50 caratteri e, al suo interno, non devono
essere presenti né spazi vuoti (blank) né apostrofi.
Per ogni coppia, la prima stringa - quella a sinistra -
indica la label (lemma o categoria) definita dall'utilizzatore, la
seconda la parola (caso Dictio.diz) o
il lemma (caso Dictionary.diz)
corrispondente già presente nel dizionario T-LAB.
Ecco qualche esempio:
(File Dictio.diz)
|
(File Dictionary.diz)
|
ACCOGLIERE;accogliamo
ACCOGLIERE;accogliate
ACCOGLIERE;accoglie
ACCOGLIERE;accoglie
------
PREPARARE;preparerà
PREPARARE;preparerai
PREPARARE;prepareranno
PREPARARE;preparerebbe
|
ACCOGLIENZA;accoglienza
ACCOGLIENZA;accogliere
ACCOGLIENZA;accogliente
------
PENSIERO_ASTRATTO;concettualizzare
PENSIERO_ASTRATTO;analisi
PENSIERO_ASTRATTO;analizzare
PENSIERO_ASTRATTO;interpretare
|
A seconda del tipo di file importato, i cambiamenti nel
dizionario del corpus seguiranno una logica diversa (vedi
sotto).
N.B.: -
Utilizzando l'opzione corpus
lemmatizzato è possibile esportare una copia del corpus
(file .txt) in cui ogni forma è sostituita con il corrispondente
lemma.
|