www.tlab.it
Liste des Locutions
(Multi-Words)
Cette option permet de créer/modifier les fichiers
des Multi-Words.
Chaque fichier Multiwords.txt peut se composer par "N" lignes
(maximum 5.000), chacune avec un mot multiple non excédant les 50
caractères et sans signes de ponctuation.
Voici quelques lignes du fichier Multiwords.txt dans le format correct:
chambre de commerce
Haute Cour de Justice
forces de l'ordre
etc etc
En cliquant sur le bouton "Appliquer cette liste …", l'utilisateur peut
produire une transformation rapide des multi-mots présents dans un
corpus en chaînes unitaires qui peuvent être identifiées et
classifiées par T-LAB
(par exemple "Autorité palestinienne" se transforme en
"Autorité_palestinienne")
Après son fonctionnement, cette option produit un nouveau
fichier (New_Corpus.txt) qui,
opportunément retitré, peut être analysé avec T-LAB.
Pour vérifier/utiliser les listes des Multiwords pendant l'importation d'un nouveau corpus l'utilisateur
doit choisir l'option "Avancé" dans la
fenêtre suivante:
|