www.tlab.it
Configuración
Automática
La elección de esta opción implica que en los análisis
siguientes se utilizarán las Palabras
Clave seleccionadas automáticamente por T-LAB.
La lista automática incluye hasta
3000 unidades lexicales pertenecientes a las categorías
gramaticales que son más densas de significado: nombres, verbos,
adjetivos y adverbios.
El criterio de selección varía en función del tipo de
corpus analizado.
Si el corpus se compone de un único texto T-LAB selecciona
simplemente las unidades lexicales con los valores más altos de
ocurrencia.
Si el corpus se compone de dos o más textos T-LAB utiliza el algoritmo
ilustrado en la nota siguiente:
a) selecciona las palabras con valores de frecuencia superiores al
umbral mínimo;
b) aplica el TF-IDF o el test del chi-cuadrado a todos los cruces de cada
palabra seleccionada para todos los textos analizados (NOTA: En el
caso del chi cuadrado, los textos deben ser máximo
500);
c) selecciona las palabras con los valores más altos en el TF-IDF o
en el test de chi cuadrado, o sea esas palabras que, en el texto,
hacen la diferencia.
La lista de palabras clave seleccionadas por
T-LAB se puede verificar
utilizando la opción Memo (véase
abajo).
|