T-LAB 10.2 - AIDE EN LIGNE - T-LAB Outils pour l'Analyse de Textes

Dans le cas d'un corpus composé d'un texte unique, et quand l'utilisateur ne fait pas recours aux variables, il n'y a aucune autre opération à faire et on peut procéder directement à l'importation.

Au contraire, quand le corpus est constitué par plusieurs textes et/ou bien on utilise des variables, la préparation du corpus doit être réalisée par le module Corpus Builder qui, de façon automatique, respecte les critères suivants:

Chaque texte ou sous-ensemble (les "parties" définies par des variables et/ou IDnumber) doit être précédé par une ligne de codage.

Chaque ligne de codage a ce format:

- elle commence par quatre astérisques (****), suivis d'un espace blanc. T-LAB lit cette séquence ainsi: "ici commence un texte ou une unité de contexte défini par l'utilisateur";

- elle continue avec des chaînes composées par des astérisques simples et des étiquettes qui définissent les sujets (IDnumber), les variables et les modalités respectives;

- elle finit avec le retour à la ligne.

Voici quelques exemples.

La ligne suivante introduit un texte (ou un sous-ensemble du corpus) codifié avec trois variables - AGE, SEXE et MET (métier) - avec les respectives modalités (adul, fem, prof).

**** *AGE_adul *SEX_fem *MET_prof

La ligne suivante introduit un texte (ou un sous-ensemble du corpus) codifié avec les mêmes variables et l'etiquette IDnumber.

**** *IDnumber_0001 *AGE_adul *SEX_fem *MET_prof

La ligne suivante introduit un texte (ou un sous-ensemble du corpus) codifié avec deux variables: ANN (année) e MAG (magazine)

**** *ANN_98 *MAG_times

Dans chaque ligne de codage, les règles T-LAB à respecter sont les suivantes :
1) chaque étiquette (clef) - soit pour des variables, soit pour les modalités - ne peut être entrecoupée par des espaces blancs.
2) chaque étiquette - soit pour des variables, soit pour les modalités - ne peut être plus longue de de 25 caractères (min. 2).
3) chaque étiquette de variable doit être liée à la respective modalité avec le tiret bas ("_").
4) entre deux différentes variables, c.-à-d. avant l'astérisque suivant, un espace blanc doit être inséré.
5) chaque variable - avec les respectives modalités - doit être assignée pour chaque sous-ensemble du corpus.
6) le variables utilisables sont maximum 50, chacune avec un maximum de 150 modalités.
7) le numéro maximum d'IDnumber est fixé à 99.999 pour les textes brefs (Max. 2.000 caractères chacun, ex. réponses à questions ouvertes) et à 30.000 pour les autres cas.