www.tlab.it
Configuración Automática y
Configuración Personalizada
La elección entre la configuración automática (A) o personalizada (B) está relacionada con el listado
de Palabras Clave que se utilizan en
todos los análisis implementadas por T-LAB. Dicha elección será
reversible siempre y cuando el usuario no haya aportado
modificaciones al diccionario del corpus.
A) CONFIGURACIÓN AUTOMÁTICA
Escoger a la configuración automática implica que
el listado de palabras clave incluya hasta un
máximo de 5000 unidades lexicales, todas ellas escogidas
automáticamente por T-LAB y las categorías
gramaticales que son más densas de significado: nombres, verbos,
adjetivos y adverbios.
El criterio de selección varía en función del tipo de
corpus analizado.
Si el corpus se compone de un único texto T-LAB selecciona
simplemente las unidades lexicales con los valores más altos de
ocurrencia.
Si el corpus se compone de dos o más textos T-LAB utiliza el algoritmo
ilustrado en la nota siguiente:
a) selecciona las palabras con valores de frecuencia superiores al
umbral mínimo;
b) aplica el TF-IDF o el test del chi-cuadrado a todos los cruces de cada
palabra seleccionada para todos los textos analizados (NOTA: En el
caso del chi cuadrado, los textos deben ser máximo
500);
c) selecciona las palabras con los valores más altos en el TF-IDF o
en el test de chi cuadrado, o sea esas palabras que, en el texto,
hacen la diferencia.
NOTA:
- En el caso de que el corpus esté compuesto por dos o
más textos, el usuario puede escoger el criterio de selección a
utilizar en la fase de importación (CHI cuadrado o TF-IDF).
- Al activarse la opción de impostaciones automáticas, en
la tabla que contiene el listado de Palabras Clave aparecerá
también la columna 'T-LAB'. En ésta se recoge el grado de
relevancia de cada ítem en base al criterio escogido por el usuario
(véase abajo).
B) CONFIGURACIÓN PERSONALIZADA
En el caso de escoger la configuración personalizada, el usuario podrá
seleccionar las unidades lexicales
(palabras, lemas o categorías) a incluir en los análisis
T-LAB que
implementará posteriormente. También podrá renombrar y agrupar
dichas unidades lexicales.
En la tabla se reproduce la lista
(lista 1) de las unidades lexicales con valores de ocurrencia
iguales o superiores al umbral
prefijado.
Algunas de estas, las indicadas con una "v", forman parte de una
sub-lista (lista 2) sugerida por T-LAB (véase Configuración Automática).
En función de los análisis que desea
efectuar, el usuario decidirá si usar/modificar la lista (1) o la
lista (2).
En ambos casos las operaciones
posibles son las siguientes:
- seleccionar qué lemas deben
ser excluidos del análisis;
- restablecer el uso de uno o
varios lemas;
- seleccionar/de-seleccionar
los ítems de la lista.
Un clic sobre el botón "usa la lista (1)" o sobre el
botón "usa la lista (2) " permite la opción "personalizada" de
análisis.
Para cada lema, es posible acceder a las opciones
relacionadas con las diferentes acciones a ello asociadas. Para
ello, es suficiente seleccionar cualquier ítem de la tabla y hacer
clic con el botón derecho del ratón (véase abajo).
Renombrar un solo lema
debe llevarse a cabo como sigue:
1 - asegúrese de que está activada la opción "RENOMBRAR";
2 - haga clic sobre un ítem de la lista;
3 - elige una de las palabras o tecla una ETIQUETA en su
elección;
4 - haga clic en "SUSTITUIR".
Agrupamientos de dos o más
términos se hará como sigue:
1 - seleccionar "AGRUPAR";
2 - haga clic en dos o más ítems de la lista;
3 - elija en uno de los términos o escriba una ETIQUETA en su
elección;
4 - haga clic en "SUSTITUIR".
Es posible activar ulteriores
opciones si se hace clic con el botón derecho del ratón en el
cuadro que incluye los ítems a renombrar/agrupar (A) o en el cuadro
que incluye los 'lemas eliminados' (B).
Más en concreto, y en relación al
caso (A), si se escoge la opción 'Key-Word-in-Context' es posible
acceder automáticamente a la herramienta "concordancias", que
permite verificar los contextos de ocurrencia de los diferentes
ítems (véase abajo).
Un botón específico (véase abajo) permite
importar listas personalizadas de palabras
clave.
Cada lista (archivo llamado MyList.diz) puede incluir hasta un
máximo de 10.000 palabras (min = 20).
Cada registro de la lista debe ser una palabra sin signos de
puntuación y sin espacios en blanco.
Un modelo de archivo MyList.diz se crea automáticamente
por T-LAB al guardar
cualquier lista de su palabras (véase el botón correspondiente en
la parte inferior izquierda).
Las configuraciones de cada análisis (hasta un
máximo de 10) pueden ser guardadas y ser restablecidas. Eso
significa que lo mismo corpus - sin necesidad
de una importación adicional - puede ser analizado con varios
diccionarios y varias selecciones de palabras.
Además, T-LAB
permite que las configuraciones personalizadas sean realizadas y
modificadas durante varias sesiones, también después de operaciones
como Personalización del
Diccionario.
|