www.tlab.it
Preparazione del
Corpus
Nel caso di un unico documento (o di un corpus trattato
come unico testo) T-LAB non richiede ulteriori accorgimenti:
basta selezionare l'opzione 'Importare un
singolo file...' e procedere (vedi la sezione corrispondente di
questo manuale).
Quando, invece, il corpus è costituito da più testi e
vengono utilizzate codifiche che rinviano
all'uso di qualche variabile, nella fase
di preparazione bisogna utilizzare il modulo Corpus Builderr che
- in maniera automatica - procede alla trasformazione di vari
materiali testuali in un file corpus pronto per essere importato da
T-LAB.
N.B.:
Prima dell'importazione, è consigliabile una revisione
ortografica del materiale da analizzare. Inoltre, se alcune sigle
rilevanti sono intervallate da punteggiatura (ad es. "O.N.U." o
"M.P.I.") se ne raccomanda la trasformazione in stringhe unitarie
(as es. "ONU" o "O_N_U", "MPI" o "M_P_I"); ciò in quanto, nella
fase di normalizzazione, T-LAB interpreta i segni di punteggiatura come
separatori;
Al termine della fase di preparazione si raccomanda di
creare una nuova cartella di lavoro con al suo interno il solo file
corpus da importare.
|