Canal-U

Mon compte
LIMSI

Utilisation des représentations continues des mots et des paramètres prosodiques pour la détection d’erreurs dans les transcriptions automatiques de la parole


Copier le code pour partager la vidéo :
<div style="position:relative;padding-bottom:56.25%;padding-top:10px;height:0;overflow:hidden;"><iframe src="https://www.canal-u.tv/video/limsi/embed.1/utilisation_des_representations_continues_des_mots_et_des_parame_tres_prosodiques_pour_la_detection_d_erreurs_dans_les_transcriptions_automatiques_de_la_parole.32433?width=100%&amp;height=100%" style="position:absolute;top:0;left:0;width:100%;height: 100%;" width="550" height="306" frameborder="0" allowfullscreen scrolling="no"></iframe></div> Si vous souhaitez partager une séquence, indiquez le début de celle-ci , et copiez le code : h m s
Contacter le contributeur
J’aime
Imprimer
partager facebook twitter Google +

Utilisation des représentations continues des mots et des paramètres prosodiques pour la détection d’erreurs dans les transcriptions automatiques de la parole

JEP-TALN-RECITAL 2016 - Mercredi 6 juillet 2016

Session commune JEP/TALN 1

Utilisation des représentations continues des mots et des paramètres prosodiques pour la détection d’erreurs dans les transcriptions automatiques de la parole

Sahar Ghannay, Yannick Estève, Nathalie Camelin, Camille Dutrey, Fabian Santiago and Martine Adda-Decker

Résumé : Récemment, l'utilisation des représentations continues de mots a connu beaucoup de succès dans plusieurs tâches de traitement du langage naturel.Dans ce papier, nous nous proposons d'étudier leur utilisation pour la tâche de détection des erreurs de transcriptions automatiques de la parole.
Dans une architecture neuronale, nous les avons intégrés et évalués, en plus des paramètres classiques (lexicales, syntaxiques,etc.), et d'un ensemble de paramètres prosodiques .
De plus, la principale contribution de cet article porte sur la combinaison de différentes représentations : plusieurs approches de combinaison sont proposées et évaluées afin de tirer profit de leur complémentarité.
Les expériences sont effectuées sur des transcriptions automatiques du corpus ETAPE générées par le système de reconnaissance automatique du LIUM.
Les résultats obtenus sont meilleurs que ceux d'un système état de l'art basé sur les champs aléatoires conditionnels.
Pour terminer, nous montrons que la mesure de confiance produite est bien calibrée selon une évaluation en terme d'Entropie Croisée Normalisée.


  •  
  •  
    Date de réalisation : 6 Juillet 2016
    Lieu de réalisation : Inalco, Paris
    Durée du programme : 28 min
    Classification Dewey : Informatique appliquée à la linguistique
  •  
    Catégorie : Conférences
    Niveau : Tous publics / hors niveau, niveau Doctorat (LMD), Recherche
    Disciplines : Linguistique, Informatique
    Collections : JEP-TALN-RECITAL 2016, Session commune JEP/TALN 1
    ficheLom : Voir la fiche LOM
  •  
    Auteur(s) : Ghannay Sahar, Estève Yannick, Camelin Nathalie, Dutrey Camille, Santiago Fabian, Adda-Decker Martine
  •  
    Langue : Français
    Mots-clés : Traitement Automatique des Langues, Traitement Automatique de la Parole
 

commentaires


Ajouter un commentaire Lire les commentaires
*Les champs suivis d’un astérisque sont obligatoires.
Aucun commentaire sur cette vidéo pour le moment (les commentaires font l’objet d’une modération)
 

Dans la même collection

FMSH
 
Facebook Twitter Google+
Mon Compte