www.tlab.it
Umbral de
frecuencia
Durante el procesamiento preliminar de datos
T-LAB calcula
un umbral mínimo de frecuencia para seleccionar las palabras (o los
lemas) que serán introducidas en los análisis del menú Configuratión
Automática y, en particular, para construir la lista de
palabras clave.
En cualquier caso, para garantizar la fiabilidad de
algunos cálculos estadísticos, el umbral mínimo T-LAB no es
inferior a 4.
El algoritmo para este cómputo se
documenta en uno de los libros de la Bibliografía (Bolasco, 1999) y prevé los pasos
siguientes:
- detección de la gama de las
frecuencia bajas, que, a partir de la frecuencia mínima "1", es
definida por el primer "salto" en los valores crecientes de las
frecuencias;
- elección del valor de umbral que,
según las dimensiones del corpus, corresponde al valor mínimo en el
primer o en el segundo decile (10% o 20%) de la gama.
|