Soglia di frequenza
Nella fase di importazione T-LAB calcola una soglia di frequenza minima
per selezionare le parole (forme o lemmi) da inserire nelle analisi
del menu configurazioni automatiche e, in particolare, per
costruire l'elenco delle Parole-Chiave.
In ogni caso, per garantire l'affidabilità di
alcuni calcoli statistici, la soglia minima T-LAB è fissata a 4.
Per questo calcolo viene utilizzato un
algoritmo documentato in uno dei volumi in bibliografia (Bolasco S., 1999), e che prevede i
seguenti passi:
-
individuazione del range delle frequenze basse, che - a partire
dalla frequenza minima ("1") - è definito dal primo "salto" nei
valori crescenti delle occorrenze;
-
scelta del valore di soglia che, a seconda delle dimensioni del
corpus, viene fatto corrispondere al valore minimo nel primo o nel
secondo decile (10% o 20%) del range.
|