www.tlab.it
Multi-Words (Locuzioni e
Poliformi)
Questa opzione consente di creare/modificare liste
di Multiwords.
Ogni lista
(file Multiwords.txt ) è costituita da
N linee (max 5.000), ciascuna con una sequenza di due o più parole
(lunghezza massima: 50 caratteri, senza segni di
punteggiatura).
La struttura del file Multiwords.txt è quella di un semplice elenco,
come l'esempio seguente:
ordine pubblico
servizio sanitario nazionale
val di fassa
forze dell'ordine
etc etc
Un click sul pulsante "Applica
questa lista …" consente una rapida trasformazione delle
parole multiple presenti in un corpus in altrettante stringhe che
possono essere riconosciute e classificate da T-LAB
(per es. "ministro dell'interno" viene trasformato in
"ministro_dell_interno").
Al termine della trasformazione, è disponibile un nuovo
file (New_Corpus.txt) che,
opportunamente rinominato, può essere importato con T-LAB.
Per verificare/usare liste di Multiwords durante la fase di
importazione di un nuovo corpus è
sufficiente selezionare l'opzione "Avanzata" nella finestra
seguente:
|