T-LAB Home
T-LAB 10.2 - AIDE EN LIGNE Prev Page Prev Page
T-LAB
Introduction
Ce que T-LAB fait et ce qu' il vous permet de faire
Conditions requises et performances
Préparation du Corpus
Préparation du Corpus
Critères Structuraux
Critères Formels
Fichier
Importer un unique fichier...
Préparer un Corpus (Corpus Builder)
Ouvrir un Project Existant
Configurations d'Analyse
Configurations Automatiques Personalisées
Personnalisation du Dictionnaire
Analyse des Co-occurrences
Associations de Mots
Analyse des Mots Associés et Cartes Conceptuelles
Comparaisons entre paires de Mots-Clés
Analyse des Séquences et Analyse des Réseaux
Concordances
Co-occurrence Toolkit
Analyse Thématiques
Analyse Thématique des Contextes Élémentaires
Modélisation des Thèmes Émergents
Classification Thématique des Documents
Classification Basée sur ded Dictionnaires
Textes et Discours comme Systèmes Dynamiques
Analyses Comparatives
Analyse des Spécificités
Analyse des Correspondances
Analyse des Correspondances Multiples
Classification (Cluster Analysis)
Décomposition en Valeurs Singulières
Outils Lexique
Text Screening / Désambiguïsations
Vocabulaire du Corpus
Liste de Mots vides
Listes de Locutions
Segmentation de Mots
Autres Outils
Variable Manager
Recherche Avancée dans le Corpus
Classification des Nouveaux Documents
Contextes Clé de Mots Thématiques
Exporter des Tableaux Personnalisées
Editeur
Importer-Exporter une liste des Identificateurs
Glossaire
Analyse des Correspondances
Chaînes de Markov
Chi-Deux
Classification (Cluster Analysis)
Codage
Contextes élémentaires
Corpus et Sous-ensembles
Désambiguïsation
Document Primaire
Graph Maker
Homographes
IDnumber
Index d'Association
Isotopie
Lemmatisation
Lexie et Lexicalization
MDS
Mots-Clés
Mots et Lemmes
Multiwords
N-grammes
Naïve Bayes
Normalisation
Noyaux Thématiques
Occurrences et Cooccurrences
Polarités Factorielles
Profil
Seuil de Fréquence
Spécificités
Stop Word List
Tableaux de Données
Unité d'Analyse
Unité de Contexte
Unité Lexicale
TF-IDF
Valeur-Test
Variables et Modalités
Bibliographie
www.tlab.it

Configuration Automatique et Configuration Personnalisée


Le choix de la configuration automatique (A) ou personnalisée (B) concerne la liste des mots-clés utilisés dans toutes les analyses effectuées au moyen de T-LAB. Ce choix est réversible jusqu'à ce que l'utilisateur n' effectue pas des opérations qui modifient le Dictionnaire du corpus.

A) CONFIGURATION AUTOMATIQUE

Le choix de la configuration automatique signifie que la liste des mots-clés comprenne jusqu'à 5000 unités lexicales sélectionnées automatiquement par T-LAB et appartenant aux catégories grammaticales qui sont plus denses de sens: noms, verbes, adjectifs et adverbes.

Le critère de sélection change selon le genre de fichier analysé.

Si le corpus est un texte unique T-LAB choisit simplement les mots avec les valeurs d'occurrence les plus élevées.

Quand le corpus se compose de deux textes ou plus T-LAB emploie l'algorithme suivant:

a) il choisit les mots avec les valeurs d'occurrence plus élevées que le seuil minimum;
b) il applique le TF-IDF ou le test du chi-deux à toutes les croix de chaque mot pour tous les textes analysés (N.B. : Dans le cas du chi-deux, les textes analysés doivent être maximum 500);
c) il choisit les mots avec les valeurs du TF-IDF ou du chi-deux les plus élevées, c'est-à-dire les mots qui, dans le corpus, font la différence.

N.B.:
Dans le cas où le corpus est constitué par deux ou plusieurs textes, l'utilisateur peut choisir le critère de sélection (chi-carré ou bien TF-IDF) dans le stade de l'importation (voir ci-dessous).

- Lorsque l' option pour la configuration automatique est activée, le tableau avec la liste des Mots-clés inclut une colonne 'T-LAB' qui indique l' importance de chaque élément selon le critère sélectionné (voir ci-dessous)..

B) CONFIGURATION PERSONNALISEE

Le choix de la configuration personnalisée permet à l' utilisateur de sélectionner, renommer et regrouper les unités lexicales (mots, lemmes ou catégories) à inclure dans les analyses successives de T-LAB.

Dans le tableau est reportée la liste (liste 1) des unités lexicales avec des valeurs d'occurrence égales ou supérieures au seuil préfixé. Certaines d'entre elles, celles indiquées avec un "v", font partie d'une sous-liste (liste 2) proposée par T-LAB (voir Configuration Automatique).

En fonction des analyses qu'il entend effectuer, l'utilisateur peut décider d'utiliser/modifier la liste (1) ou la liste (2).

Dans les deux cas les opérations possibles sont les suivantes:

  • modifier la valeur de seuil;
  • sélectionner les lemmes à rejeter de l'analyse;
  • rétablir l'utilisation d'un lemme ou plus;
  • sélectionner/de-sélectionner les items à utiliser.

Un clic sur le bouton "utiliser liste (1)" ou le bouton "utiliser liste (2 )" rend active l'option "personnalisée" des configurations d'analyse.

Les options qui concernent les interventions sur les lemmes individuels sont accessibles par le bouton droit de la souris en sélectionnant un élément quelconque du tableau (voir ci-dessous ).

Pour renommer chaque lemme agir comme suit :

1. s' assurer que l' option "renommer" soit active;
2. cliquer sur un item du tableau;
3. choisir un des mots ou bien frapper un label à votre choix;
4. cliquer sur "remplacer".


Les regroupements de deux ou plus lemmes doivent être effectués comme suit :

1. sélectionner la modalité "regroupements";
2. cliquer sur deux ou plus items du tableau;
3. choisir (à l' aide d' un clic) un des mots ou bien frapper un label à votre choix;
4. cliquer sur "remplacer".

Des options supplémentaires peuvent être activées à l'aide du bouton à droite dans la case avec les éléments à renommer / regrouper (A) ou dans la case avec les " lemmes supprimés " (B).

En particulier, lorsque - dans le cas (A) - on sélectionne l' option "key-word-in-Context ", vous pouvez accéder automatiquement à l'instrument Concordances et vérifier les contextes d'occurrence des différents éléments (voir ci-dessous).

 

Un bouton spécifique (voir ci-dessous) vous permet d'importer des listes personnalisées de mots-clés.
Chaque liste à importer (ficher nommé MyList.diz), peut contenir jusqu'à un maximum de 10.000 lignes (min = 20).
Chaque ligne de votre liste doit être un mot sans espaces vides ni signes de ponctuation.
Un modèle de fichier MyList.diz est automatiquement créé par T-LAB lors de l'enregistrement de votre liste des mots clé (voir le bouton approprié en bas à gauche).

Le paramétrage des analyses, à savoir aussi bien la sélection des lemmes (ou catégories) que le dictionnaire utilisé, peut être sauvegardé et récupéré à travers les boutons réservés à cet usage. Ceci signifie que le même corpus - sans avoir besoin d'être importé à nouveau - peut être analysé avec différents dictionnaires et avec des sélections différentes de mots-clés. Ceci pour un maximum de 10 differents paramétrages.

En outre, dans T-LAB il est prévu que les paramétrages puissent être revus en plusieurs sessions, même en utilisant plusieurs fois la fonction Personnalisation du Dictionnaire.