T-LAB Home
T-LAB 10.2 - AIDE EN LIGNE Prev Page Prev Page
T-LAB
Introduction
Ce que T-LAB fait et ce qu' il vous permet de faire
Conditions requises et performances
Préparation du Corpus
Préparation du Corpus
Critères Structuraux
Critères Formels
Fichier
Importer un unique fichier...
Préparer un Corpus (Corpus Builder)
Ouvrir un Project Existant
Configurations d'Analyse
Configurations Automatiques Personalisées
Personnalisation du Dictionnaire
Analyse des Co-occurrences
Associations de Mots
Analyse des Mots Associés et Cartes Conceptuelles
Comparaisons entre paires de Mots-Clés
Analyse des Séquences et Analyse des Réseaux
Concordances
Co-occurrence Toolkit
Analyse Thématiques
Analyse Thématique des Contextes Élémentaires
Modélisation des Thèmes Émergents
Classification Thématique des Documents
Classification Basée sur ded Dictionnaires
Textes et Discours comme Systèmes Dynamiques
Analyses Comparatives
Analyse des Spécificités
Analyse des Correspondances
Analyse des Correspondances Multiples
Classification (Cluster Analysis)
Décomposition en Valeurs Singulières
Outils Lexique
Text Screening / Désambiguïsations
Vocabulaire du Corpus
Liste de Mots vides
Listes de Locutions
Segmentation de Mots
Autres Outils
Variable Manager
Recherche Avancée dans le Corpus
Classification des Nouveaux Documents
Contextes Clé de Mots Thématiques
Exporter des Tableaux Personnalisées
Editeur
Importer-Exporter une liste des Identificateurs
Glossaire
Analyse des Correspondances
Chaînes de Markov
Chi-Deux
Classification (Cluster Analysis)
Codage
Contextes élémentaires
Corpus et Sous-ensembles
Désambiguïsation
Document Primaire
Graph Maker
Homographes
IDnumber
Index d'Association
Isotopie
Lemmatisation
Lexie et Lexicalization
MDS
Mots-Clés
Mots et Lemmes
Multiwords
N-grammes
Naïve Bayes
Normalisation
Noyaux Thématiques
Occurrences et Cooccurrences
Polarités Factorielles
Profil
Seuil de Fréquence
Spécificités
Stop Word List
Tableaux de Données
Unité d'Analyse
Unité de Contexte
Unité Lexicale
TF-IDF
Valeur-Test
Variables et Modalités
Bibliographie
www.tlab.it

Classification (Cluster Analysis)


N.B.: Les images de cette section font référence à une version précédente de T-LAB. En T-LAB 10, l'aspect est légèrement différent. En outre: a) il y a un nouveau bouton (TREE MAP PREVIEW) qui permet à l'utilisateur de créer plusieurs graphiques dynamiques au format HTML; b) le bouton DENDROGRAMME a été remplacé par l'outil Graph Maker; c) une galerie d'images à accès rapide qui fonctionne comme un menu supplémentaire permet de basculer entre les différentes sorties en un seul clic (voir l'image ci-dessous).

Cette option met en marche un calcul qui emploie les résultats d'une précédente Analyse des Correspondances; en particulier, le calcul emploie les coordonnées des objets (unités lexicales ou unités de contextes) sur les premiers axes factoriels (pour un maximum de 10).

Selon les cas, l'utilisateur peut choisir entre trois techniques de classification:

a) hiérarchique (méthode Ward);
b) K-means (méthode MacQueen);
c) hdbscan (hierarchical DBSCAN).

Les deux premières (a, b) permettent d'explorer (tableaux et graphiques) des solutions de 3 à 20 cluster; alors que la troisième (c), qui nécessite un paramètre supplémentaire (c'est-à-dire le nombre minimum de mots dans un cluster), permet à l'utilisateur d'explorer une seule solution.

N.B.: Lorsque la méthode 'hiérarchique' est sélectionnée, T-LAB rend disponible une option (voir le bouton 'épurer' ci-dessous) qui permet à l'utilisateur de combiner les méthodes de Ward et K-Means.

À la fin du traitement, T-LAB montre des graphiques et des tableaux.

Les graphiques représentent les classes dans l'espace détecté par la précédente Analyse des Correspondances.

N.B.: Pour explorer les diverses combinaisons des axes factoriels il suffit de les sélectionner dans les boîtes appropriées ("Axe X", "Axe Y").

Dans le cas de classification hiérarchique, l'utilisateur peut facilement explorer (graphiques et tableaux) les partitions différentes.

Dendrogrammes, graphiques circulaires (pie charts) et histogrammes montrent les caractéristiques de chaque partition.

Des histogrammes nous permettent de vérifier les rapports entre les classes et les variables.


Les tableaux sont de deux types:

(A) si les objets classés sont les unités lexicales, pour chacune d'elles (et pour chaque classe) sont montrées les occurrences respectives ('OCC') et le distances ('DIST') au centroïde; aussi, pour chaque variable qui est sensiblement associée à la classe examinée, est montrée la Valeur Test.

(B) si les objets classés sont des contextes élémentaires, les caractéristiques de chaque classe (unités lexicales ou variables) sont décrites au moyen de la même méthode employée dans Analyse Thématique des Contextes Élémentaires (voir ci-dessous).

Dans le cas d'analyses réalisées avec des méthodes hiérarchiques ou K-means T-LAB permet de visualiser et exporter un fichier (voir bouton "Output HTML") dans lequel les caractéristiques des clusters et certaines mesures concernant la qualité de la partition du partage en examen sont reportées.