-
- Date de réalisation : 23 Juin 2015
- Durée du programme : 28 min
- Classification Dewey : Traduction automatique, Informatique appliquée à la linguistique
-
- Catégorie : Conférences
- Niveau : Tous publics / hors niveau
- Disciplines : Linguistique, Informatique, Modelisation et simulation
- Collections : Session traduction (taln 2015)
- ficheLom : Voir la fiche LOM
02c - Apprentissage discriminant des modèles continus de traduction (taln2015)
Sessions orales TALN 2015 – Mardi 23 juin 2015
Session Traduction
Apprentissage discriminant des modèles continus de traduction
Quoc-Khanh Do, Alexandre Allauzen et François Yvon
Résumé : Alors que les réseaux neuronaux occupent une place de plus en plus importante dans le traitement automatique des langues, les méthodes d’apprentissage actuelles utilisent pour la plupart des critères qui sont décorrélés de l’application. Cet article propose un nouveau cadre d’apprentissage discriminant pour l’estimation des modèles continus de traduction. Ce cadre s’appuie sur la définition d’un critère d’optimisation permettant de prendre en compte d’une part la
métrique utilisée pour l’évaluation de la traduction et d’autre part l’intégration de ces modèles au sein des systèmes de traduction automatique. De plus cette méthode d’apprentissage est comparée aux critères existants d’estimation que sont le maximum de vraisemblance et l’estimation contrastive bruitée. Les expériences menées sur la tâches de traduction des séminaires TED Talks de l’anglais vers le français montrent la pertinence d’un cadre discriminant d’apprentissage mais dont les performances sont liées au choix d’une stratégie d’initialisation adéquate. Nous montrons qu’avec une initialisation judicieuse des gains significatifs en terme de score\bleu peuvent être obtenus.
métrique utilisée pour l’évaluation de la traduction et d’autre part l’intégration de ces modèles au sein des systèmes de traduction automatique. De plus cette méthode d’apprentissage est comparée aux critères existants d’estimation que sont le maximum de vraisemblance et l’estimation contrastive bruitée. Les expériences menées sur la tâches de traduction des séminaires TED Talks de l’anglais vers le français montrent la pertinence d’un cadre discriminant d’apprentissage mais dont les performances sont liées au choix d’une stratégie d’initialisation adéquate. Nous montrons qu’avec une initialisation judicieuse des gains significatifs en terme de score\bleu peuvent être obtenus.
commentaires
Ajouter un commentaire Lire les commentaires