www.tlab.it
Omografia
Due o più parole (forme o lemmi) sono omografe quando hanno la stessa forma grafica
(sono scritte allo stesso modo), ma hanno significati
diversi.
Nella lingua italiana, casi di questo tipo sono
migliaia.
In T-LAB
sono implementate delle procedure di disambiguazione che ne riducono l'incidenza; in
particolare, la normalizzazione di locuzioni, multiwords e tempi composti dei verbi.
In questo modo - ad esempio - la
normalizzazione della sequenza "il punto di vista" (trasformata in
"il_punto_di_vista"), consente di distinguere le specifiche
occorrenze di "punto" e "vista" (due classici
omografi); così come la
normalizzazione della sequenza "sono
stato" ("sono_stato") consente di
distinguere i casi in cui si parla dello "stato" come condizione o
come forma politica.
|