www.tlab.it
Configuration
Automatique
Le choix de cette option signifie que dans les analyses
suivantes seront utilisés les Mots-clés
sélectionnés automatiquement par T-LAB.
La liste automatique inclut jusqu'à
3000 unités lexicales appartenant aux catégories
grammaticales qui sont plus denses de sens: noms, verbes, adjectifs
et adverbes.
Le critère de sélection change selon le genre de fichier
analysé.
Si le corpus est un texte unique T-LAB choisit simplement les mots avec les
valeurs d'occurrence les plus élevées.
Quand le corpus se compose de deux textes ou plus
T-LAB emploie l'algorithme
suivant:
a) il choisit les mots avec les valeurs d'occurrence plus
élevées que le seuil minimum;
b) il applique le TF-IDF ou le test du chi-deux à toutes les croix de chaque mot
pour tous les textes analysés (N.B. : Dans le cas du chi-deux, les
textes analysés doivent être maximum 500);
c) il choisit les mots avec les valeurs du TF-IDF ou du chi-deux
les plus élevées, c'est-à-dire les mots qui, dans le corpus, font
la différence.
La liste des mots-clés sélectionnés par T-LAB peut être contrôlée à l'aide de la
fonction Memo (voir ci-dessous).

|