www.tlab.it
Personnalisation du
Dictionnaire
L'option Personnalisation du
Dictionnaire ouvre une fenêtre par laquelle l'utilisateur
peut intervenir sur le dictionnaire du corpus, c'est-à-dire qu'il
peut renommer ou grouper les lemmes
(voir l'option '3' ci-dessous), exporter son dictionnaire (voir
l'option '4' ci-dessous) ou importer un dictionnaire extérieur (voir
l'option '5' ci-dessous).
Le point de départ est un tableau (le Dictionnaire du Corpus) avec toutes les
correspondances forme/lemme, les occurrences respectives dans le
corpus et quelques étiquettes qui se rapportent à la lemmatisation automatique (colonne "INF").
Avant chaque intervention, en sélectionnant une
forme spécifique et en utilisant le bouton droit de la souris, vous
pouvez vérifier les concordances concordances qui vous intéressent.
En tout cas, avant toute intervention, après avoir
cliqué sur le "sélection des mots clés", doit être activé la
configuation personnalisée (voir ci-dessus l'option "1").
.
Les interventions
possibles, quoique différentes dans leurs buts (révision des
lemmatisations et/ou applications des grilles pour l'analyse du
contenu), donnent toutes une réorganisation de la base de données
de T-LAB, c.-à-d. créent différents tableaux pour
les analyses suivantes.
Par conséquent toutes les opérations doivent être faites seulement
sur les mots (lemmes ou catégories) considérés intéressants pour
les analyses suivantes. T-LAB, en
fait, rend disponible une autre option, Configuration
Personnalisée (voir Sélection des Mots-Clés), avec
laquelle l'utilisateur peut décider quels lemmes retenir et
lesquels abandonner (exclus de l'analyse).
Les deux fonctions (Personnalisation du
dictionnaire et Configuration
Personnalisée) sont étroitement reliées entre
elles et l'utilisateur peut facilement se déplacer de l'une à
l'autre afin de changer ses choix.
En Personnalisation du
dictionnaire, pour changer les labels (ou "lemmes")
attribués aux mots, deux modalités d'intervention sont prévues
:
- une qui prévoit la possibilité de déplacer des
mots choisis dans la boîte du côté droit et, après, de les renommer
avec l'option "remplacer" (N.B.: dans ce cas, la nouvelle étiquette
peut être définie à l'aide d'un des lemmes sélectionné ou en tapant
dans le champ "étiquette" );
- une qui prévoit l'importation d'un dictionnaire
personnalisé, réservée aux utilisateurs experts qui disposent de
leurs propres listes pour classifier les mots présents en un ou
plus corpus.
N.B.: L' utilisation du bouton droit dans la case
Renommer / Regrouper habilite un menu contextuel qui permet trois
opérations: a) vérifier les concordances (KeyWord-in-Context) de
l'élément sélectionné; b) supprimer de la case l'élément
sélectionné ; c) supprimer de la case tous les éléments
sélectionnés.
Pour importer un dictionnaire
personnalisé il faut que l'utilisateur ait préparé un
fichier Dictio.diz ou bien un fichier
Dizionary.dizqui peuvent
se composer par "n" lignes, chacune avec un couple de
chaînes séparées par le caractère ";".
La longueur maximum d'une chaîne (mot, lemme ou catégorie) est de
50 caractères: aucun espace vide ou apostrophe ne doit être
inclus.
Pour chaque couple, la première chaîne - du côté gauche - indique
l'étiquette (lemme ou catégorie) défini par l'utilisateur, la
seconde indique le mot (cas Dictio.diz ) ou le lemme (cas
Dictionary.diz ) correspondant déjà
présent dans le dictionnaire de T-LAB.
Voici quelques exemples:
(Fichier Dictio.diz)
|
(Fichier Dictionary.diz)
|
EXAMINER;examina
EXAMINER;examinai
EXAMINER;examinaient
EXAMINER;examinais
------
BEAU;beau
BEAU;beaux
BEAU;belle
BEAU;belles
|
ACCUEIL;accueil
ACCUEIL;accueillir
ACCUEIL;accueillant
------
PENSÉE_ABSTRAITE;conceptualiser
PENSÉE_ABSTRAITE;analyse PENSÉE_ABSTRAITE;analyser
PENSÉE_ABSTRAITE;interpréter
|
Selon le type de fichier que vous importez, les changements
seron comme suit:
N.B.: - en
utilisant l'option corpus lemmatisé il est
possible d'exporter une copie du corpus (fichier .txt) dans
laquelle chaque mot sera remplacé par le lemme
correspondant; -
quand l'utilisateur modifie le dictionnaire d'un corpus,
il ne peut plus utiliser l'option configuration automatique pour
analyser le même corpus.
|