Notice
05c - Stratégies de sélection des exemples pour l’apprentissage actif avec des CRF (taln2015)
- document 1 document 2 document 3
- niveau 1 niveau 2 niveau 3
Descriptif
Sessions orales TALN 2015 – Mardi 23 juin 2015
Session Extraction d’information
Stratégies de sélection des exemples pour l’apprentissage actif avec des CRF
Vincent Claveau et Ewa Kijak
Résumé : Beaucoup de problèmes de TAL sont désormais modélisés comme des tâches d’apprentissage supervisé. De ce fait, le coût des annotations des exemples par l’expert représente un problème important. L’apprentissage actif (active learning) apporte un cadre à ce problème, permettant de contrôler le coût d’annotation tout en maximisant, on l’espère, la performance à la tâche visée, mais repose sur le choix difficile des exemples à soumettre à l’expert.
Dans cet article, nous examinons et proposons des stratégies de sélection des exemples pour le cas spécifique des CRF, outil largement utilisé en TAL.
Nous proposons d’une part une méthode simple corrigeant un biais de certaines méthodes de l’état de l’art. D’autre part, nous détaillons une méthode originale de sélection s’appuyant sur un critère de respect des proportion dans les jeux de données manipulés.
Le bien-fondé de ces propositions est vérifié au travers de plusieurs tâches et jeux de données,
incluant reconnaissance d’entités nommées, chunking, phonétisation, désambiguïsation de sens.
Dans la même collection
-
05d - Identification de facteurs de risque pour des patients diabétiques à partir de comptes-rendus…
Sessions orales TALN 2015 – Mardi 23 juin 2015 Session Extraction d’information Identification de facteurs de risque pour des patients diabétiques à partir de comptes-rendus cliniques par des
-
05b - Oublier ce qu’on sait, pour mieux apprendre ce qu’on ne sait pas : une étude sur les contrain…
Sessions orales TALN 2015 – Mardi 23 juin 2015 Session Extraction d’information Oublier ce qu’on sait, pour mieux apprendre ce qu’on ne sait pas : une étude sur les contraintes de type dans les
-
05a - Apprentissage par imitation pour l’étiquetage de séquences : vers une formalisation des métho…
Sessions orales TALN 2015 – Mardi 23 juin 2015 Session Extraction d’information Apprentissage par imitation pour l’étiquetage de séquences : vers une formalisation des méthodes d’étiquetage easy
Sur le même thème
-
Rédiger et traduire des métadonnées pour un article : suivez le guide !
Présentation en vidéo du guide "Rédaction et traduction des métadonnées" à destination des auteurs et comités éditoriaux de revues afin d'améliorer le référencement des publications à l'international.
-
Table ronde - Salon PAREIL
JEP-TALN-RECITAL 2016 - Vendredi 8 juillet 2016 Salon PAREIL (Partenariats Recherche et Industries de la Langue) Table ronde Animée par Pierre Zweigenbaum Résumé : La table ronde est centrée les
-
Bilinguismes et compliance phonique
JEP-TALN-RECITAL 2016 - Vendredi 8 juillet 2016 Session commune JEP/TALN 3 Bilinguismes et compliance phonique Marie Philippart de Foy, Véronique Delvaux, Kathy Huet, Myriam Piccaluga, Rima Rabeh and
-
Conférence invitée de Mark Liberman - From Human Language Technology to Human Language Science
LibermanMarkFrom Human Language Technology to Human Language Science
-
Traduire deux Nobel de littérature, Gao Xingjian et Mo Yan
Baryosher-ChemounyMurielDutraitNoëlNoël DUTRAIT est professeur au département d’études asiatiques en langue et littérature chinoises à l’Université d’Aix-Marseille où il dirige l’équipe de recherche sur les « Littératures d’Extrême
-
02c - Apprentissage discriminant des modèles continus de traduction (taln2015)
Sessions orales TALN 2015 – Mardi 23 juin 2015 Session Traduction Apprentissage discriminant des modèles continus de traduction Quoc-Khanh Do, Alexandre Allauzen et François Yvon Résumé : Alors
-
05a - Apprentissage par imitation pour l’étiquetage de séquences : vers une formalisation des métho…
Sessions orales TALN 2015 – Mardi 23 juin 2015 Session Extraction d’information Apprentissage par imitation pour l’étiquetage de séquences : vers une formalisation des méthodes d’étiquetage easy
-
08a - Méthode faiblement supervisée pour l’extraction d’opinion ciblée dans un domaine spécifique (…
Sessions orales TALN 2015 – Mardi 23 juin 2015 Session Opinions et sentiments Méthode faiblement supervisée pour l’extraction d’opinion ciblée dans un domaine spécifique Romaric Besançon Résumé :
-
-
03c - Désambiguïsation lexicale à base de connaissances par sélection distributionnelle et traits s…
Sessions orales TALN 2015 – Mardi 23 juin 2015 Session Désambiguïsation Désambiguïsation lexicale à base de connaissances par sélection distributionnelle et traits sémantiques (Article RECITAL)
-
06a - Typologie des langues automatique à partir de treebanks (taln2015)
Sessions orales TALN 2015 – Mardi 23 juin 2015 Session Classification et Alignement Typologie des langues automatique à partir de treebanks Philippe Blache, Grégroie de Montcheuil et Stéphane
-
09b - Extraction automatique de relations sémantiques dans les définitions : approche hybride, cons…
Sessions orales TALN 2015 – Mardi 23 juin 2015 Session Sémantique Extraction automatique de relations sémantiques dans les définitions : approche hybride, construction d’un corpus de relations