-
- Date de réalisation : 23 Juin 2015
- Durée du programme : 31 min
- Classification Dewey : Traduction automatique, Informatique appliquée à la linguistique
-
- Catégorie : Conférences
- Niveau : Tous publics / hors niveau
- Disciplines : Linguistique, Informatique, Modelisation et simulation
- Collections : Session sémantique (taln 2015)
- ficheLom : Voir la fiche LOM

09c - Déclasser les voisins non sémantiques pour améliorer les thésaurus distributionnels (taln2015)
09c - Déclasser les voisins non sémantiques pour améliorer les thésaurus distributionnels (taln2015)
Sessions orales TALN 2015 – Mardi 23 juin 2015
Session Sémantique
Déclasser les voisins non sémantiques pour améliorer les thésaurus distributionnels
Olivier Ferret
Résumé : La
plupart des méthodes d’amélioration des thésaurus distributionnels se
focalisent sur les moyens – représentations ou mesures de similarité –
de mieux détecter la similarité sémantique entre les mots. Dans cet
article, nous proposons un point de vue inverse : nous cherchons à
détecter les voisins sémantiques associés à une entrée les moins
susceptibles d’être liés sémantiquement à elle et nous utilisons cette
information pour réordonner ces voisins. Pour détecter les faux voisins
sémantiques d’une entrée, nous adoptons une approche s’inspirant de la
désambiguïsation sémantique en construisant un classifieur permettant de
différencier en contexte cette entrée des autres mots. Ce classifieur
est ensuite appliqué à un échantillon des occurrences des voisins de
l’entrée pour repérer ceux les plus éloignés de l’entrée. Nous évaluons
cette méthode pour des thésaurus construits à partir de cooccurrents
syntaxiques et nous montrons l’intérêt de la combiner avec les méthodes
décrites dans (Ferret, 2013) selon une stratégie de type vote.
commentaires
Ajouter un commentaire Lire les commentaires