Conférence
Notice
Lieu de réalisation
Inalco, Paris
Langue :
Français
Crédits
Serge Linares (Intervention), Killian Janod (Intervention), Mohamed Morchid (Intervention), Richard Dufour (Intervention), Renato De Mori (Intervention)
Conditions d'utilisation
Droit commun de la propriété intellectuelle
DOI : 10.60527/sksh-gb37
Citer cette ressource :
Serge Linares, Killian Janod, Mohamed Morchid, Richard Dufour, Renato De Mori. LIMSI. (2016, 6 juillet). Auto-encodeurs pour la compréhension de documents parlés , in Session commune JEP/TALN 1. [Vidéo]. Canal-U. https://doi.org/10.60527/sksh-gb37. (Consultée le 25 juin 2024)

Auto-encodeurs pour la compréhension de documents parlés

Réalisation : 6 juillet 2016 - Mise en ligne : 1 février 2017
  • document 1 document 2 document 3
  • niveau 1 niveau 2 niveau 3
Descriptif

JEP-TALN-RECITAL 2016 - Mercredi 6 juillet 2016 

Session commune JEP/TALN 1

Auto-encodeurs pour la compréhension de documents parlés

Killian Janod, Mohamed Morchid, Richard Dufour, Georges Linarès and Renato De Mori

Résumé : Les représentations de documents au moyen d'approches à base de réseaux de neurones ont montré des améliorations significatives dans de nombreuses tâches du traitement du langage naturel. Dans le cadre d'applications réelles, où des conditions d'enregistrement difficiles peuvent être rencontrées, la transcription automatique de documents parlés peut générer un nombre de mots mal transcrits important. Cet article propose une représentation des documents parlés très bruités utilisant des caractéristiques apprises par un auto-encodeur profond supervisé. La méthode proposée s'appuie à la fois sur les documents bruités et leur équivalent propre annoté manuellement pour estimer une représentation plus robuste des documents bruités. Cette représentation est évaluée sur le corpus DECODA sur une tâche de classification thématique de conversations téléphoniques atteignant une précision de 83% avec un gain d'environ 6%.

Intervention

Dans la même collection