T-LAB Home
T-LAB PLUS 2019 - AIUDA EN RED Prev Page Prev Page
T-LAB
Introducción
Qué hace y qué permite hacer
Requisitos y prestaciones
Preparación del corpus
Preparación del corpus
Criterios Estructurales
Criterios Formales
Archivo
Importar un único archivo...
Preparar un Corpus (Corpus Builder)
Abrir un projecto ya existente
Configuraciones de Análisis
Configuración Automática y Personalizada
Personalización del Diccionario
Análisis de Co-ocurrencias
Asociaciones de Palabras
Análisis de Co-Palabras y Mapas Conceptuales
Comparaciones entre Parejas de Palabras-Clave
Análisis de Secuencias y Análisis de Redes
Concordancias
Análisis Temáticos
Análisis Temático de Contextos Elementales
Modelización de Temas Emergentes
Clasificación Temática de Documentos
Clasificación Basada en Diccionarios
Contextos Clave de Palabras Temáticas
Análisis Comparativos
Análisis de Especificidades
Análisis de Correspondencias
Análisis de Correspondencias Múltiples
Cluster Analysis
Descomposición de Valores Singulares
Herramientas Léxico
Text Screening / Desambiguaciónes
Vocabulario
Palabras Vacías
Multi-Palabras
Segmentación de Palabras
Otras Herramientas
Variable Manager
Búsqueda avanzada en el Corpus
Tablas de Contingencias
Editor
Glosario
Análisis de Correspondencias
Cadenas de Markov
Chi-cuadrado
Cluster Analysis
Codificación
Contextos Elementales
Corpus y Subconjuntos
Desambiguación
Documentos Primarios
Especificidad
Graph Maker
Homógrafos
IDnumber
Índices de Asociación
Isotopía
Lematización
Lexia y Lexicalización
MDS
Multiwords (Multi-Palabras)
N-gramas
Naïve Bayes
Normalización del Corpus
Núcleos Temáticos
Ocurrencias y Co-ocurrencias
Palabras y Lemas
Palabras Clave
Perfil
Polos de Factores
Stop Word List
Tablas de Datos
Umbral de Frecuencia
TF-IDF
Unitad de Análisis
Unidad de Contexto
Unidad Lexical
Valor Test
Variables y Modalidades
Bibliografía
www.tlab.it

Configuración Automática y Configuración Personalizada


La elección entre la configuración automática (A) o personalizada (B) está relacionada con el listado de Palabras Clave que se utilizan en todos los análisis implementadas por T-LAB. Dicha elección será reversible siempre y cuando el usuario no haya aportado modificaciones al diccionario del corpus.

A) CONFIGURACIÓN AUTOMÁTICA

Escoger a la configuración automática implica que el listado de palabras clave incluya hasta un máximo de 5000 unidades lexicales, todas ellas escogidas automáticamente por T-LAB y las categorías gramaticales que son más densas de significado: nombres, verbos, adjetivos y adverbios.

El criterio de selección varía en función del tipo de corpus analizado.

Si el corpus se compone de un único texto T-LAB selecciona simplemente las unidades lexicales con los valores más altos de ocurrencia.

Si el corpus se compone de dos o más textos T-LAB utiliza el algoritmo ilustrado en la nota siguiente:

a) selecciona las palabras con valores de frecuencia superiores al umbral mínimo;

b) aplica el TF-IDF o el test del chi-cuadrado a todos los cruces de cada palabra seleccionada para todos los textos analizados (NOTA: En el caso del chi cuadrado, los textos deben ser máximo 500);

c) selecciona las palabras con los valores más altos en el TF-IDF o en el test de chi cuadrado, o sea esas palabras que, en el texto, hacen la diferencia.

NOTA:

- En el caso de que el corpus esté compuesto por dos o más textos, el usuario puede escoger el criterio de selección a utilizar en la fase de importación (CHI cuadrado o TF-IDF).

- Al activarse la opción de impostaciones automáticas, en la tabla que contiene el listado de Palabras Clave aparecerá también la columna 'T-LAB'. En ésta se recoge el grado de relevancia de cada ítem en base al criterio escogido por el usuario (véase abajo).

 

B) CONFIGURACIÓN PERSONALIZADA

 

En el caso de escoger la configuración personalizada, el usuario podrá seleccionar las unidades lexicales (palabras, lemas o categorías) a incluir en los análisis T-LAB que implementará posteriormente. También podrá renombrar y agrupar dichas unidades lexicales.

En la tabla se reproduce la lista (lista 1) de las unidades lexicales con valores de ocurrencia iguales o superiores al umbral prefijado.
Algunas de estas, las indicadas con una "v", forman parte de una sub-lista (lista 2) sugerida por T-LAB (véase Configuración Automática).

En función de los análisis que desea efectuar, el usuario decidirá si usar/modificar la lista (1) o la lista (2).

En ambos casos las operaciones posibles son las siguientes:

  • cambiar el valor umbral;
  • seleccionar qué lemas deben ser excluidos del análisis;
  • restablecer el uso de uno o varios lemas;
  • seleccionar/de-seleccionar los ítems de la lista.

Un clic sobre el botón "usa la lista (1)" o sobre el botón "usa la lista (2) " permite la opción "personalizada" de análisis.

Para cada lema, es posible acceder a las opciones relacionadas con las diferentes acciones a ello asociadas. Para ello, es suficiente seleccionar cualquier ítem de la tabla y hacer clic con el botón derecho del ratón (véase abajo).

 

Renombrar un solo lema debe llevarse a cabo como sigue:
1 - asegúrese de que está activada la opción "RENOMBRAR";
2 - haga clic sobre un ítem de la lista;
3 - elige una de las palabras o tecla una ETIQUETA en su elección;
4 - haga clic en "SUSTITUIR".


Agrupamientos de dos o más términos se hará como sigue:
1 - seleccionar "AGRUPAR
";
2 - haga clic en dos o más ítems de la lista;
3 - elija en uno de los términos o escriba una ETIQUETA en su elección;
4 - haga clic en "SUSTITUIR".

Es posible activar ulteriores opciones si se hace clic con el botón derecho del ratón en el cuadro que incluye los ítems a renombrar/agrupar (A) o en el cuadro que incluye los 'lemas eliminados' (B).

Más en concreto, y en relación al caso (A), si se escoge la opción 'Key-Word-in-Context' es posible acceder automáticamente a la herramienta "concordancias", que permite verificar los contextos de ocurrencia de los diferentes ítems (véase abajo).


Un botón específico (véase abajo) permite importar listas personalizadas de palabras clave.
Cada lista (archivo llamado MyList.diz) puede incluir hasta un máximo de 10.000 palabras (min = 20).
Cada registro de la lista debe ser una palabra sin signos de puntuación y sin espacios en blanco.

Un modelo de archivo MyList.diz se crea automáticamente por T-LAB al guardar cualquier lista de su palabras (véase el botón correspondiente en la parte inferior izquierda).

Las configuraciones de cada análisis (hasta un máximo de 10) pueden ser guardadas y ser restablecidas. Eso significa que lo mismo corpus - sin necesidad de una importación adicional - puede ser analizado con varios diccionarios y varias selecciones de palabras.

Además, T-LAB permite que las configuraciones personalizadas sean realizadas y modificadas durante varias sesiones, también después de operaciones como Personalización del Diccionario.