www.tlab.it
Critères Formels
Dans le cas d'un corpus composé
d'un texte unique, et quand l'utilisateur ne fait pas recours aux
variables, il n'y a
aucune autre opération à faire et on peut procéder
directement à l'importation.
Au contraire, quand le corpus est constitué par plusieurs textes
et/ou bien on utilise des variables, la préparation du corpus doit
être réalisée par le module Corpus
Builder qui, de façon automatique, respecte les critères
suivants:
Chaque texte ou sous-ensemble (les "parties" définies par
des variables et/ou IDnumber) doit être précédé par une ligne de codage.
Chaque ligne de codage a ce
format:
- elle commence par
quatre astérisques (****), suivis d'un
espace blanc. T-LAB lit cette séquence ainsi: "ici
commence un texte ou une unité de contexte défini par
l'utilisateur";
- elle continue avec des chaînes
composées par des astérisques simples
et des étiquettes qui définissent les sujets (IDnumber), les variables et les modalités respectives;
- elle finit avec le
retour à la ligne.
Voici quelques exemples.
La ligne suivante introduit un texte (ou un sous-ensemble
du corpus) codifié avec trois variables - AGE, SEXE et MET (métier)
- avec les respectives modalités (adul, fem, prof).
**** *AGE_adul *SEX_fem *MET_prof
La ligne suivante introduit un texte (ou un sous-ensemble
du corpus) codifié avec les mêmes variables et l'etiquette
IDnumber.
**** *IDnumber_0001 *AGE_adul *SEX_fem *MET_prof
La ligne suivante introduit un texte (ou un sous-ensemble
du corpus) codifié avec deux variables: ANN (année) e MAG
(magazine)
**** *ANN_98 *MAG_times
Dans chaque ligne de codage, les règles T-LAB
à respecter sont les suivantes :
1) chaque étiquette (clef) - soit pour des variables, soit pour les
modalités - ne peut être entrecoupée par des espaces blancs.
2) chaque étiquette - soit pour des variables, soit pour les
modalités - ne peut être plus longue de de 25 caractères (min.
2).
3) chaque étiquette de variable doit être liée à la respective
modalité avec le tiret bas ("_").
4) entre deux différentes variables, c.-à-d. avant l'astérisque
suivant, un espace blanc doit être inséré.
5) chaque variable -
avec les respectives modalités - doit être assignée pour chaque
sous-ensemble du corpus. 6) le variables
utilisables sont maximum 50, chacune avec un maximum de
150 modalités.
7) le numéro maximum
d'IDnumber est fixé à 99.999 pour les textes brefs (Max. 2.000
caractères chacun, ex. réponses à questions ouvertes) et à 30.000
pour les autres cas.
|