-
- Date de réalisation : 23 Juin 2015
- Durée du programme : 27 min
- Classification Dewey : Traduction automatique, Informatique appliquée à la linguistique
-
- Catégorie : Conférences
- Niveau : Tous publics / hors niveau
- Disciplines : Linguistique, Informatique, Modelisation et simulation
- Collections : Session classification et alignement (taln 2015)
- ficheLom : Voir la fiche LOM

06c - Mesurer la similarité entre phrases grâce à Wikipédia en utilisant une indexation aléatoire (taln2015)
06c - Mesurer la similarité entre phrases grâce à Wikipédia en utilisant une indexation aléatoire (taln2015)
Sessions orales TALN 2015 – Mardi 23 juin 2015
Session Classification et Alignement
Mesurer la similarité entre phrases grâce à Wikipédia en utilisant une indexation aléatoire
Hai Hieu Vu, Jeanne Villaneau, Farida Saïd et Pierre-François Marteau
Résumé : Ce
papier présente une méthode pour mesurer la similarité sémantique entre
phrases qui utilise Wikipédia comme unique ressource linguistique et
qui est, de ce fait, utilisable pour un grand nombre de langues. Basée
sur une représentation vectorielle, elle utilise une indexation
aléatoire pour réduire la dimension des espaces manipulés. En outre,
elle inclut une technique de calcul des vecteurs de termes qui corrige les défauts engendrés par l’utilisation d’un corpus aussi
général que Wikipédia. Le système a été évalué sur les données de
SemEval 2014 en anglais avec des résultats très encourageants, au-dessus
du niveau moyen des systèmes en compétition. Il a également été testé
sur un ensemble de paires de phrases en français, à partir de ressources
que nous avons construites et qui seront mises à la libre disposition
de la communauté scientifique.
commentaires
Ajouter un commentaire Lire les commentaires