www.tlab.it
Multi-Palabras
(Multi-Words)
Esta opción permite crear/modificar las listas de
Multi-Palabras (Multi-Words) en la
ventana siguiente.
Cada lista (archivo Multiwords.txt) tiene que ser compuesta de N
líneas (máximo 5000), cada una con un conjunto de dos o más
palabras (longitud máxima: 50 caracteres, sin signos de
puntuación).
He aquí algunas líneas de Multiwords.txt en el
formato correcto:
transporte público
sistema de información
banco de órganos
etc etc
Chascando en el botón "Aplicar esta
lista... ", el usuario puede producir una rápida
transformación de las multi-palabras presentes en un corpus en
cadenas que pueden ser reconocidas y clasificadas por
T-LAB (por ej. "sistema de información" es
transformado en "sistema_de_información").
Después del funcionamiento, esta opción genera un nuevo
archivo (New_Corpus.txt) que,
correctamente retitulado, puede ser analizado por T-LAB.
Para verificar/utilizar listas de Multi-Palabras durante la
importación de un nuevo corpus el
usuario tiene que seleccionar la opción "Avanzado" en la ventana siguiente:
|