Homographes
Deux mots ou plus sont homographes quand ils ont la même forme graphique
(c'est-à-dire qu'ils sont écrits de la même manière) mais ont un
sens différent.
Dans la langue italienne et celle française il y a
des milliers d'homographes. Dans T-LAB
sont implémentées des routines de désambiguïsation qui réduisent leur impact. En
particulier, la normalisation des multiwords et des verbes composés.
Ainsi, par
exemple, - dans la langue italienne -, la normalisation de la
locution "il punto di vista" ("il_punto_di_vista") nous permet de
distinguer les occurrences de "punto" et "vista" (deux homographes
typiques). Ainsi - dans la langue française - la normalisation de
la locution "aide_mémoire " nous permet de distinguer les
occurrences de l'homographe "mémoire
".
|