www.tlab.it
Personalización del
Diccionario
La opción Personalización del
Diccionario abre una ventana en la que el usuario puede
realizar algunas operaciones en el diccionario del
corpus.
Para los propósitos de los análisis siguientes, su uso es opcional.
El usuario puede volver a denominar o agrupar los lemas disponibles
(véase abajo la opción '3'); además, puede exportar el diccionario
construido (véase abajo la opción '4') o importar un diccionario personalizado (véase abajo la opción
'5').
El punto de partida es una tabla (el Diccionario del Corpus) con todas las
correspondencias palabra/lema, sus respectivas ocurrencias en el
corpus y algunas etiquetas que se refieren a la lematización automática (columna "INF").
Antes realizar cualquier tipo de operación, es posible
verificar las concordancias relevantes
para el usuario (Key-Word-in-Context) utilizando el botón derecho
del ratón (véase arriba la opción '2'); adémas, después de hacer
clic en la pestaña "selección de palabras clave", debe ser
seleccionada la configuración personalizada (véase arriba la opción
'1').
Las operaciones posibles,
aún persiguiendo finalidades diversas (revisión de las
lematizaciones y/o usos de plantillas para el análisis del
contenido), todas se traducen en una reorganización de la base de
datos T-LAB, y por
tanto en tablas diferentes para el análisis de los datos. De ello
se desprende que todas las operaciones se deben realizar en las
palabras (lemas o categorías) consideradas interesantes para los
análisis sucesivos. T-LAB, de hecho, pone a disposición
otra opción, Configuración Personalizada
(véase 'Selección de Palabras Clave'), con la cual los usuarios
pueden decidir qué lemas "conservar" y cuáles "descartar".
Las dos funciones (Personalización del
Diccionario y Configuración
Personalizada) se relacionan mucho entre
ellas y el usuario puede moverse fácilmente de acá para allá,
también para cambiar su elecciones.
En Personalización del
Diccionario para cambiar las etiquetas (o 'lemas') asignadas
a las palabras, están previstas dos modalidades de acción:
- mover las palabras seleccionadas (clic) al box de la
derecha y, sucesivamente, volverlas a denominar usando la opción
"substituye" (N.B.: En este caso, la nueva etiqueta puede ser
definida usando uno de los lemas seleccionados - haga clic en un
elemento presente en el box de "renombrar/agrupar" - o escribiendo
en "etiqueta");
- importar de un diccionario
personalizado (N.B.: Esta opción es particularmente
aconsejada a los usuarios expertos, puesto que ya disponen de sus
listados para clasificar las palabras contenidas en uno o más
corpus).
NOTA: Haciendo clic con el botón derecho del ratón en el
cuadro "renombrar/agrupar" se activa un menú contextual que permite
3 operaciones: a) verificar las concordancias del ítem seleccionado
(KeyWord-in-Context) b) eliminar del cuadro el ítem seleccionado c)
eliminar del cuadro todos los ítems seleccionados
Para poder importar un diccionario
personalizado es
necesario que el usuario haya predispuesto previamente un archivo
llamado Dictio.diz
o Dictionary.diz.
Estos pueden componerse de "n" líneas, cada una con un par de
cadenas, separadas por medio del carácter ";".
La longitud máxima de una cadena (palabra, lema o categoría) es 50
caracteres y en su interior no debe haber ni espacios en blanco ni
apostrófos.
Para cada par, la primera cadena - la de izquierda - indica la
etiqueta (lema o categoría) definida por el usuario, la segunda
indica la palabra (caso Dictio.diz) o
el lema (caso Dictionary.diz)
correspondiente ya presente en el diccionario T-LAB.
He aquí algunos ejemplos:
(Fichero Dictio.diz)
|
(Fichero Dictionary.diz)
|
CARGAR;carga
CARGAR;cargaba
CARGAR;cargábamos
CARGAR;cargaban
------
ARISTOCRÁTICO;aristocrática
ARISTOCRÁTICO;aristocráticas
ARISTOCRÁTICO;aristocrático
ARISTOCRÁTICO;aristocráticos
|
BIOTECH;biotech
BIOTECH;biotecnología
BIOTECH;biotecnológico
---
MENTE_ABSTRACTA;clasifiar
MENTE_ABSTRACTA;discernir
MENTE_ABSTRACTA;análisis
|
Según el tipo
de fichero que usted importa, los cambios serán como
sigue:
ATENCIÓN:
- Mediante la opción corpus lematizado
es posible exportar una copia del corpus (archivo .txt) en la cual
cada palabra será substituida por el lema correspondiente;
- Cuando se ha modificado el diccionario, los análisis siguientes
(en el mismo corpus) están disponibles solamente como configuración personalizada.
|