Conférence
Notice
Langue :
Français
Conditions d'utilisation
Droit commun de la propriété intellectuelle
DOI : 10.60527/xf6x-5871
Citer cette ressource :
CEMU. (2015, 23 juin). 05c - Stratégies de sélection des exemples pour l’apprentissage actif avec des CRF (taln2015) , in Session extraction d'information (taln 2015). [Vidéo]. Canal-U. https://doi.org/10.60527/xf6x-5871. (Consultée le 13 décembre 2024)

05c - Stratégies de sélection des exemples pour l’apprentissage actif avec des CRF (taln2015)

Réalisation : 23 juin 2015 - Mise en ligne : 17 juillet 2015
  • document 1 document 2 document 3
  • niveau 1 niveau 2 niveau 3
Descriptif

Sessions orales TALN 2015 – Mardi 23 juin 2015

Session Extraction d’information

Stratégies de sélection des exemples pour l’apprentissage actif avec des CRF

Vincent Claveau et Ewa Kijak

Résumé : Beaucoup de problèmes de TAL sont désormais modélisés comme des tâches d’apprentissage supervisé. De ce fait, le coût des annotations des exemples par l’expert représente un problème important. L’apprentissage actif (active learning) apporte un cadre à ce problème, permettant de contrôler le coût d’annotation tout en maximisant, on l’espère, la performance à la tâche visée, mais repose sur le choix difficile des exemples à soumettre à l’expert.
Dans cet article, nous examinons et proposons des stratégies de sélection des exemples pour le cas spécifique des CRF, outil largement utilisé en TAL.
Nous proposons d’une part une méthode simple corrigeant un biais de certaines méthodes de l’état de l’art. D’autre part, nous détaillons une méthode originale de sélection s’appuyant sur un critère de respect des proportion dans les jeux de données manipulés.
Le bien-fondé de ces propositions est vérifié au travers de plusieurs tâches et jeux de données,
incluant reconnaissance d’entités nommées, chunking, phonétisation, désambiguïsation de sens.

Dans la même collection

Sur le même thème