Notice
05c - Stratégies de sélection des exemples pour l’apprentissage actif avec des CRF (taln2015)
- document 1 document 2 document 3
- niveau 1 niveau 2 niveau 3
Descriptif
Sessions orales TALN 2015 – Mardi 23 juin 2015
Session Extraction d’information
Stratégies de sélection des exemples pour l’apprentissage actif avec des CRF
Vincent Claveau et Ewa Kijak
Résumé : Beaucoup de problèmes de TAL sont désormais modélisés comme des tâches d’apprentissage supervisé. De ce fait, le coût des annotations des exemples par l’expert représente un problème important. L’apprentissage actif (active learning) apporte un cadre à ce problème, permettant de contrôler le coût d’annotation tout en maximisant, on l’espère, la performance à la tâche visée, mais repose sur le choix difficile des exemples à soumettre à l’expert.
Dans cet article, nous examinons et proposons des stratégies de sélection des exemples pour le cas spécifique des CRF, outil largement utilisé en TAL.
Nous proposons d’une part une méthode simple corrigeant un biais de certaines méthodes de l’état de l’art. D’autre part, nous détaillons une méthode originale de sélection s’appuyant sur un critère de respect des proportion dans les jeux de données manipulés.
Le bien-fondé de ces propositions est vérifié au travers de plusieurs tâches et jeux de données,
incluant reconnaissance d’entités nommées, chunking, phonétisation, désambiguïsation de sens.
Dans la même collection
-
05b - Oublier ce qu’on sait, pour mieux apprendre ce qu’on ne sait pas : une étude sur les contrain…
Sessions orales TALN 2015 – Mardi 23 juin 2015 Session Extraction d’information Oublier ce qu’on sait, pour mieux apprendre ce qu’on ne sait pas : une étude sur les contraintes de type dans les
-
05a - Apprentissage par imitation pour l’étiquetage de séquences : vers une formalisation des métho…
Sessions orales TALN 2015 – Mardi 23 juin 2015 Session Extraction d’information Apprentissage par imitation pour l’étiquetage de séquences : vers une formalisation des méthodes d’étiquetage easy
-
05d - Identification de facteurs de risque pour des patients diabétiques à partir de comptes-rendus…
Sessions orales TALN 2015 – Mardi 23 juin 2015 Session Extraction d’information Identification de facteurs de risque pour des patients diabétiques à partir de comptes-rendus cliniques par des
Sur le même thème
-
HTAL : de la collecte au dépôt
LéonJacquelineFaivreCamilleLe projet HTAL, Histoire du traitement automatique des langues est un fond inédit, composé d'environ 1000 documents. Jacqueline Léon, directrice de recherche émérite au CNRS, les a collectés tout au
-
Rédiger et traduire des métadonnées pour un article : suivez le guide !
Présentation en vidéo du guide "Rédaction et traduction des métadonnées" à destination des auteurs et comités éditoriaux de revues afin d'améliorer le référencement des publications à l'international.
-
Table ronde - Salon PAREIL
JEP-TALN-RECITAL 2016 - Vendredi 8 juillet 2016 Salon PAREIL (Partenariats Recherche et Industries de la Langue) Table ronde Animée par Pierre Zweigenbaum Résumé : La table ronde est centrée les
-
Bilinguismes et compliance phonique
JEP-TALN-RECITAL 2016 - Vendredi 8 juillet 2016 Session commune JEP/TALN 3 Bilinguismes et compliance phonique Marie Philippart de Foy, Véronique Delvaux, Kathy Huet, Myriam Piccaluga, Rima Rabeh and
-
Conférence invitée de Mark Liberman - From Human Language Technology to Human Language Science
LibermanMarkFrom Human Language Technology to Human Language Science
-
Traduire deux Nobel de littérature, Gao Xingjian et Mo Yan
Baryosher-ChemounyMurielDutraitNoëlNoël DUTRAIT est professeur au département d’études asiatiques en langue et littérature chinoises à l’Université d’Aix-Marseille où il dirige l’équipe de recherche sur les « Littératures d’Extrême
-
04a - Grammaires phrastiques et discursives fondées sur TAG : une approche de D-STAG avec les ACG (…
Sessions orales TALN 2015 – Mardi 23 juin 2015 Session Syntaxe et paraphrase Grammaires phrastiques et discursives fondées sur TAG : une approche de D-STAG avec les ACG Laurence Danlos,
-
06b - Attribution d’Auteur : approche multilingue fondée sur les répétitions maximales (taln2015)
Sessions orales TALN 2015 – Mardi 23 juin 2015 Session Classification et Alignement Attribution d’Auteur : approche multilingue fondée sur les répétitions maximales Romain Brixtel, Charlotte
-
09c - Déclasser les voisins non sémantiques pour améliorer les thésaurus distributionnels (taln2015)
Sessions orales TALN 2015 – Mardi 23 juin 2015 Session Sémantique Déclasser les voisins non sémantiques pour améliorer les thésaurus distributionnels Olivier Ferret Résumé : La plupart des
-
02b - Multi-alignement vs bi-alignement : à plusieurs, c’est mieux ! (taln2015)
Sessions orales TALN 2015 – Mardi 23 juin 2015 Session Traduction Multi-alignement vs bi-alignement : à plusieurs, c’est mieux ! Olivier Kraif Résumé : Dans cet article, nous proposons une
-
04d - Extraction automatique de paraphrases grand public pour les termes médicaux (taln2015)
Sessions orales TALN 2015 – Mardi 23 juin 2015 Session Syntaxe et paraphrase Extraction automatique de paraphrases grand public pour les termes médicaux Natalia Grabar et Thierry Hamon Présenté
-
07c - Analyse d’expressions temporelles dans les dossiers électroniques patients (taln2015)
Sessions orales TALN 2015 – Mardi 23 juin 2015 Session Compréhension et paraphrase Analyse d’expressions temporelles dans les dossiers électroniques patients Mike Donald Tapi Nzali, Aurélie Névéol