T-LAB Home
T-LAB 10.2 - AIDE EN LIGNE Prev Page Prev Page
T-LAB
Introduction
Ce que T-LAB fait et ce qu' il vous permet de faire
Conditions requises et performances
Préparation du Corpus
Préparation du Corpus
Critères Structuraux
Critères Formels
Fichier
Importer un unique fichier...
Préparer un Corpus (Corpus Builder)
Ouvrir un Project Existant
Configurations d'Analyse
Configurations Automatiques Personalisées
Personnalisation du Dictionnaire
Analyse des Co-occurrences
Associations de Mots
Analyse des Mots Associés et Cartes Conceptuelles
Comparaisons entre paires de Mots-Clés
Analyse des Séquences et Analyse des Réseaux
Concordances
Co-occurrence Toolkit
Analyse Thématiques
Analyse Thématique des Contextes Élémentaires
Modélisation des Thèmes Émergents
Classification Thématique des Documents
Classification Basée sur ded Dictionnaires
Textes et Discours comme Systèmes Dynamiques
Analyses Comparatives
Analyse des Spécificités
Analyse des Correspondances
Analyse des Correspondances Multiples
Classification (Cluster Analysis)
Décomposition en Valeurs Singulières
Outils Lexique
Text Screening / Désambiguïsations
Vocabulaire du Corpus
Liste de Mots vides
Listes de Locutions
Segmentation de Mots
Autres Outils
Variable Manager
Recherche Avancée dans le Corpus
Classification des Nouveaux Documents
Contextes Clé de Mots Thématiques
Exporter des Tableaux Personnalisées
Editeur
Importer-Exporter une liste des Identificateurs
Glossaire
Analyse des Correspondances
Chaînes de Markov
Chi-Deux
Classification (Cluster Analysis)
Codage
Contextes élémentaires
Corpus et Sous-ensembles
Désambiguïsation
Document Primaire
Graph Maker
Homographes
IDnumber
Index d'Association
Isotopie
Lemmatisation
Lexie et Lexicalization
MDS
Mots-Clés
Mots et Lemmes
Multiwords
N-grammes
Naïve Bayes
Normalisation
Noyaux Thématiques
Occurrences et Cooccurrences
Polarités Factorielles
Profil
Seuil de Fréquence
Spécificités
Stop Word List
Tableaux de Données
Unité d'Analyse
Unité de Contexte
Unité Lexicale
TF-IDF
Valeur-Test
Variables et Modalités
Bibliographie
www.tlab.it

Personnalisation du Dictionnaire


L'option Personnalisation du Dictionnaire ouvre une fenêtre par laquelle l'utilisateur peut intervenir sur le dictionnaire du corpus, c'est-à-dire qu'il peut renommer ou grouper les lemmes (voir l'option '3' ci-dessous), exporter son dictionnaire (voir l'option '4' ci-dessous) ou importer un dictionnaire extérieur (voir l'option '5' ci-dessous).

Le point de départ est un tableau (le Dictionnaire du Corpus) avec toutes les correspondances forme/lemme, les occurrences respectives dans le corpus et quelques étiquettes qui se rapportent à la lemmatisation automatique (colonne "INF").

Avant chaque intervention, en sélectionnant une forme spécifique et en utilisant le bouton droit de la souris, vous pouvez vérifier les concordances concordances qui vous intéressent.

En tout cas, avant toute intervention, après avoir cliqué sur le "sélection des mots clés", doit être activé la configuation personnalisée (voir ci-dessus l'option "1").
.

Les interventions possibles, quoique différentes dans leurs buts (révision des lemmatisations et/ou applications des grilles pour l'analyse du contenu), donnent toutes une réorganisation de la base de données de T-LAB, c.-à-d. créent différents tableaux pour les analyses suivantes.

Par conséquent toutes les opérations doivent être faites seulement sur les mots (lemmes ou catégories) considérés intéressants pour les analyses suivantes. T-LAB, en fait, rend disponible une autre option, Configuration Personnalisée (voir Sélection des Mots-Clés), avec laquelle l'utilisateur peut décider quels lemmes retenir et lesquels abandonner (exclus de l'analyse).

Les deux fonctions (Personnalisation du dictionnaire et Configuration Personnalisée) sont étroitement reliées entre elles et l'utilisateur peut facilement se déplacer de l'une à l'autre afin de changer ses choix.

En Personnalisation du dictionnaire, pour changer les labels (ou "lemmes") attribués aux mots, deux modalités d'intervention sont prévues :

- une qui prévoit la possibilité de déplacer des mots choisis dans la boîte du côté droit et, après, de les renommer avec l'option "remplacer" (N.B.: dans ce cas, la nouvelle étiquette peut être définie à l'aide d'un des lemmes sélectionné ou en tapant dans le champ "étiquette" );

- une qui prévoit l'importation d'un dictionnaire personnalisé, réservée aux utilisateurs experts qui disposent de leurs propres listes pour classifier les mots présents en un ou plus corpus.

N.B.: L' utilisation du bouton droit dans la case Renommer / Regrouper habilite un menu contextuel qui permet trois opérations: a) vérifier les concordances (KeyWord-in-Context) de l'élément sélectionné; b) supprimer de la case l'élément sélectionné ; c) supprimer de la case tous les éléments sélectionnés.

Pour importer un dictionnaire personnalisé il faut que l'utilisateur ait préparé un fichier Dictio.diz ou bien un fichier Dizionary.dizqui peuvent se composer par "n" lignes, chacune avec un couple de chaînes séparées par le caractère ";".
La longueur maximum d'une chaîne (mot, lemme ou catégorie) est de 50 caractères: aucun espace vide ou apostrophe ne doit être inclus.
Pour chaque couple, la première chaîne - du côté gauche - indique l'étiquette (lemme ou catégorie) défini par l'utilisateur, la seconde indique le mot (cas Dictio.diz ) ou le lemme (cas Dictionary.diz ) correspondant déjà présent dans le dictionnaire de T-LAB.

Voici quelques exemples:

(Fichier Dictio.diz) (Fichier Dictionary.diz)

EXAMINER;examina
EXAMINER;examinai
EXAMINER;examinaient
EXAMINER;examinais

------
BEAU;beau

BEAU;beaux
BEAU;belle

BEAU;belles

ACCUEIL;accueil
ACCUEIL;accueillir
ACCUEIL;accueillant

------
PENSÉE_ABSTRAITE;conceptualiser

PENSÉE_ABSTRAITE;analyse
PENSÉE_ABSTRAITE;analyser
PENSÉE_ABSTRAITE;interpréter

 

Selon le type de fichier que vous importez, les changements seron comme suit:


N.B.:
- en utilisant l'option corpus lemmatisé il est possible d'exporter une copie du corpus (fichier .txt) dans laquelle chaque mot sera remplacé par le lemme correspondant;
- quand l'utilisateur modifie le dictionnaire d'un corpus, il ne peut plus utiliser l'option configuration automatique pour analyser le même corpus.