Notice
06c - Mesurer la similarité entre phrases grâce à Wikipédia en utilisant une indexation aléatoire (taln2015)
- document 1 document 2 document 3
- niveau 1 niveau 2 niveau 3
Descriptif
Sessions orales TALN 2015 – Mardi 23 juin 2015
Session Classification et Alignement
Mesurer la similarité entre phrases grâce à Wikipédia en utilisant une indexation aléatoire
Hai Hieu Vu, Jeanne Villaneau, Farida Saïd et Pierre-François Marteau
Résumé : Ce papier présente une méthode pour mesurer la similarité sémantique entre phrases qui utilise Wikipédia comme unique ressource linguistique et qui est, de ce fait, utilisable pour un grand nombre de langues. Basée sur une représentation vectorielle, elle utilise une indexation aléatoire pour réduire la dimension des espaces manipulés. En outre, elle inclut une technique de calcul des vecteurs de termes qui corrige les défauts engendrés par l’utilisation d’un corpus aussi général que Wikipédia. Le système a été évalué sur les données de SemEval 2014 en anglais avec des résultats très encourageants, au-dessus du niveau moyen des systèmes en compétition. Il a également été testé sur un ensemble de paires de phrases en français, à partir de ressources que nous avons construites et qui seront mises à la libre disposition de la communauté scientifique.
Dans la même collection
-
06b - Attribution d’Auteur : approche multilingue fondée sur les répétitions maximales (taln2015)
Sessions orales TALN 2015 – Mardi 23 juin 2015 Session Classification et Alignement Attribution d’Auteur : approche multilingue fondée sur les répétitions maximales Romain Brixtel, Charlotte
-
06a - Typologie des langues automatique à partir de treebanks (taln2015)
Sessions orales TALN 2015 – Mardi 23 juin 2015 Session Classification et Alignement Typologie des langues automatique à partir de treebanks Philippe Blache, Grégroie de Montcheuil et Stéphane
Sur le même thème
-
Rédiger et traduire des métadonnées pour un article : suivez le guide !
Présentation en vidéo du guide "Rédaction et traduction des métadonnées" à destination des auteurs et comités éditoriaux de revues afin d'améliorer le référencement des publications à l'international.
-
Table ronde - Salon PAREIL
JEP-TALN-RECITAL 2016 - Vendredi 8 juillet 2016 Salon PAREIL (Partenariats Recherche et Industries de la Langue) Table ronde Animée par Pierre Zweigenbaum Résumé : La table ronde est centrée les
-
Bilinguismes et compliance phonique
JEP-TALN-RECITAL 2016 - Vendredi 8 juillet 2016 Session commune JEP/TALN 3 Bilinguismes et compliance phonique Marie Philippart de Foy, Véronique Delvaux, Kathy Huet, Myriam Piccaluga, Rima Rabeh and
-
Conférence invitée de Mark Liberman - From Human Language Technology to Human Language Science
LibermanMarkFrom Human Language Technology to Human Language Science
-
Traduire deux Nobel de littérature, Gao Xingjian et Mo Yan
Baryosher-ChemounyMurielDutraitNoëlNoël DUTRAIT est professeur au département d’études asiatiques en langue et littérature chinoises à l’Université d’Aix-Marseille où il dirige l’équipe de recherche sur les « Littératures d’Extrême
-
02a - Utilisation de mesures de confiance pour améliorer le décodage en traduction de parole (taln2…
Sessions orales TALN 2015 – Mardi 23 juin 2015 Session Traduction Utilisation de mesures de confiance pour améliorer le décodage en traduction de parole Laurent Besacier, Benjamin Lecouteux et
-
04c - Noyaux de réécriture de phrases munis de types lexico-sémantiques (taln2015)
Sessions orales TALN 2015 – Mardi 23 juin 2015 Session Syntaxe et paraphrase Noyaux de réécriture de phrases munis de types lexico-sémantiques Martin Gleize et Brigitte Grau Résumé : De
-
07a - Compréhension automatique de la parole sans données de référence (taln2015)
Sessions orales TALN 2015 – Mardi 23 juin 2015 Session Compréhension et paraphrase Compréhension automatique de la parole sans données de référence Emmanuel Ferreira, Bassam Jabaian et
-
10c - Utiliser les interjections pour détecter les émotions (taln2015)
Sessions orales TALN 2015 – Mardi 23 juin 2015 Session Plénière Utiliser les interjections pour détecter les émotions Amel Fraisse et Patrick Paroubek Résumé : Bien que les interjections
-
03a - Désambiguïsation d’entités pour l’induction non supervisée de schémas événementiels (taln2015)
Sessions orales TALN 2015 – Mardi 23 juin 2015 Session Désambiguïsation Désambiguïsation d’entités pour l’induction non supervisée de schémas événementiels Kiem-Hieu Nguyen, Xavier Tannier,
-
05b - Oublier ce qu’on sait, pour mieux apprendre ce qu’on ne sait pas : une étude sur les contrain…
Sessions orales TALN 2015 – Mardi 23 juin 2015 Session Extraction d’information Oublier ce qu’on sait, pour mieux apprendre ce qu’on ne sait pas : une étude sur les contraintes de type dans les
-
08b - Une méthodologie de sémantique de corpus appliquée à des tâches de fouille d’opinion et d’ana…
Sessions orales TALN 2015 – Mardi 23 juin 2015 Session Opinions et sentiments Une méthodologie de sémantique de corpus appliquée à des tâches de fouille d’opinion et d’analyse des sentiments :