T-LAB Home
T-LAB PLUS 2019 - AIUDA EN RED Prev Page Prev Page
T-LAB
Introducción
Qué hace y qué permite hacer
Requisitos y prestaciones
Preparación del corpus
Preparación del corpus
Criterios Estructurales
Criterios Formales
Archivo
Importar un único archivo...
Preparar un Corpus (Corpus Builder)
Abrir un projecto ya existente
Configuraciones de Análisis
Configuración Automática y Personalizada
Personalización del Diccionario
Análisis de Co-ocurrencias
Asociaciones de Palabras
Análisis de Co-Palabras y Mapas Conceptuales
Comparaciones entre Parejas de Palabras-Clave
Análisis de Secuencias y Análisis de Redes
Concordancias
Análisis Temáticos
Análisis Temático de Contextos Elementales
Modelización de Temas Emergentes
Clasificación Temática de Documentos
Clasificación Basada en Diccionarios
Contextos Clave de Palabras Temáticas
Análisis Comparativos
Análisis de Especificidades
Análisis de Correspondencias
Análisis de Correspondencias Múltiples
Cluster Analysis
Descomposición de Valores Singulares
Herramientas Léxico
Text Screening / Desambiguaciónes
Vocabulario
Palabras Vacías
Multi-Palabras
Segmentación de Palabras
Otras Herramientas
Variable Manager
Búsqueda avanzada en el Corpus
Tablas de Contingencias
Editor
Glosario
Análisis de Correspondencias
Cadenas de Markov
Chi-cuadrado
Cluster Analysis
Codificación
Contextos Elementales
Corpus y Subconjuntos
Desambiguación
Documentos Primarios
Especificidad
Graph Maker
Homógrafos
IDnumber
Índices de Asociación
Isotopía
Lematización
Lexia y Lexicalización
MDS
Multiwords (Multi-Palabras)
N-gramas
Naïve Bayes
Normalización del Corpus
Núcleos Temáticos
Ocurrencias y Co-ocurrencias
Palabras y Lemas
Palabras Clave
Perfil
Polos de Factores
Stop Word List
Tablas de Datos
Umbral de Frecuencia
TF-IDF
Unitad de Análisis
Unidad de Contexto
Unidad Lexical
Valor Test
Variables y Modalidades
Bibliografía
www.tlab.it

Personalización del Diccionario


La opción Personalización del Diccionario abre una ventana en la que el usuario puede realizar algunas operaciones en el diccionario del corpus.

Para los propósitos de los análisis siguientes, su uso es opcional.

El usuario puede volver a denominar o agrupar los lemas disponibles (véase abajo la opción '3'); además, puede exportar el diccionario construido (véase abajo la opción '4') o importar un diccionario personalizado (véase abajo la opción '5').

El punto de partida es una tabla (el Diccionario del Corpus) con todas las correspondencias palabra/lema, sus respectivas ocurrencias en el corpus y algunas etiquetas que se refieren a la lematización automática (columna "INF").

Antes realizar cualquier tipo de operación, es posible verificar las concordancias relevantes para el usuario (Key-Word-in-Context) utilizando el botón derecho del ratón (véase arriba la opción '2'); adémas, después de hacer clic en la pestaña "selección de palabras clave", debe ser seleccionada la configuración personalizada (véase arriba la opción '1').

 

Las operaciones posibles, aún persiguiendo finalidades diversas (revisión de las lematizaciones y/o usos de plantillas para el análisis del contenido), todas se traducen en una reorganización de la base de datos T-LAB, y por tanto en tablas diferentes para el análisis de los datos. De ello se desprende que todas las operaciones se deben realizar en las palabras (lemas o categorías) consideradas interesantes para los análisis sucesivos. T-LAB, de hecho, pone a disposición otra opción, Configuración Personalizada (véase 'Selección de Palabras Clave'), con la cual los usuarios pueden decidir qué lemas "conservar" y cuáles "descartar".

Las dos funciones (Personalización del Diccionario y Configuración Personalizada) se relacionan mucho entre ellas y el usuario puede moverse fácilmente de acá para allá, también para cambiar su elecciones.

En Personalización del Diccionario para cambiar las etiquetas (o 'lemas') asignadas a las palabras, están previstas dos modalidades de acción:

- mover las palabras seleccionadas (clic) al box de la derecha y, sucesivamente, volverlas a denominar usando la opción "substituye" (N.B.: En este caso, la nueva etiqueta puede ser definida usando uno de los lemas seleccionados - haga clic en un elemento presente en el box de "renombrar/agrupar" - o escribiendo en "etiqueta");

- importar de un diccionario personalizado (N.B.: Esta opción es particularmente aconsejada a los usuarios expertos, puesto que ya disponen de sus listados para clasificar las palabras contenidas en uno o más corpus).

NOTA: Haciendo clic con el botón derecho del ratón en el cuadro "renombrar/agrupar" se activa un menú contextual que permite 3 operaciones: a) verificar las concordancias del ítem seleccionado (KeyWord-in-Context) b) eliminar del cuadro el ítem seleccionado c) eliminar del cuadro todos los ítems seleccionados

Para poder importar un diccionario personalizado es necesario que el usuario haya predispuesto previamente un archivo llamado Dictio.diz o Dictionary.diz.
Estos pueden componerse de "n" líneas, cada una con un par de cadenas, separadas por medio del carácter ";".
La longitud máxima de una cadena (palabra, lema o categoría) es 50 caracteres y en su interior no debe haber ni espacios en blanco ni apostrófos.
Para cada par, la primera cadena - la de izquierda - indica la etiqueta (lema o categoría) definida por el usuario, la segunda indica la palabra (caso Dictio.diz) o el lema (caso Dictionary.diz) correspondiente ya presente en el diccionario T-LAB.

He aquí algunos ejemplos:

(Fichero Dictio.diz) (Fichero Dictionary.diz)

CARGAR;carga
CARGAR;cargaba
CARGAR;cargábamos
CARGAR;cargaban

------
ARISTOCRÁTICO;aristocrática

ARISTOCRÁTICO;aristocráticas
ARISTOCRÁTICO;aristocrático

ARISTOCRÁTICO;aristocráticos

BIOTECH;biotech
BIOTECH;biotecnología
BIOTECH;biotecnológico
---
MENTE_ABSTRACTA;clasifiar
MENTE_ABSTRACTA;discernir
MENTE_ABSTRACTA;análisis

Según el tipo de fichero que usted importa, los cambios serán como sigue:

 


ATENCIÓN:
- Mediante la opción corpus lematizado es posible exportar una copia del corpus (archivo .txt) en la cual cada palabra será substituida por el lema correspondiente;
- Cuando se ha modificado el diccionario, los análisis siguientes (en el mismo corpus) están disponibles solamente como configuración personalizada.