Canal-U

Mon compte

Résultats de recherche

Nombre de programmes trouvés : 427
Conférences

le (26m24s)

02b - Multi-alignement vs bi-alignement : à plusieurs, c’est mieux ! (taln2015)

Sessions orales TALN 2015 – Mardi 23 juin 2015Session TraductionMulti-alignement vs bi-alignement : à plusieurs, c’est mieux ! Olivier KraifRésumé : Dans cet article, nous proposons une méthode originale destinée à effectuer l’alignement d’un corpus multi-parallèle, i.e. comportant plus de deux langues, en prenant en compte toutes les langues simultanément (et non en composant une série de bi-alignements indépendants). Pour ce faire, nous nous appuyons sur les réseaux de correspondances lexicales constitués par les transfuges (chaînes identiques) et cognats (mots apparentés), et nous montrons comment divers ...
Voir la vidéo
Conférences

le (26m37s)

Christian Walter (FMSH) : Enjeux politiques des normes financières

Dans le cadre de la semaine du Nouveau Quartier Latin qui s'est déroulée entre le 21 mai et le 3 juin 2012, sept grandes institutions ont ouvert leurs portes : animations, conférences, performances artistiques, lieux insolites, fanfares et visites guidées… se sont succédés. L’EHESS et la FMSH ont organisé le 31 mai dans l'atrium du France - 190-198 avenue de France, 75013 Paris, le printemps des sciences humaines et sociales. Au programme : des livres, du numérique, des cartes et une dizaine de conférences de 15 minutes qui ont été filmées. >> Pour connaître le programme complet la ...
Voir la vidéo
Conférences

le (26m58s)

06c - Mesurer la similarité entre phrases grâce à Wikipédia en utilisant une indexation aléatoire (taln2015)

Sessions orales TALN 2015 – Mardi 23 juin 2015Session Classification et AlignementMesurer la similarité entre phrases grâce à Wikipédia en utilisant une indexation aléatoire Hai Hieu Vu, Jeanne Villaneau, Farida Saïd et Pierre-François Marteau Résumé : Ce papier présente une méthode pour mesurer la similarité sémantique entre phrases qui utilise Wikipédia comme unique ressource linguistique et qui est, de ce fait, utilisable pour un grand nombre de langues. Basée sur une représentation vectorielle, elle utilise une indexation aléatoire pour réduire la dimension des espaces manipulés. ...
Voir la vidéo
Conférences

le (27m15s)

02c - Apprentissage discriminant des modèles continus de traduction (taln2015)

Sessions orales TALN 2015 – Mardi 23 juin 2015Session TraductionApprentissage discriminant des modèles continus de traduction Quoc-Khanh Do, Alexandre Allauzen et François YvonRésumé : Alors que les réseaux neuronaux occupent une place de plus en plus importante dans le traitement automatique des langues, les méthodes d’apprentissage actuelles utilisent pour la plupart des critères qui sont décorrélés de l’application. Cet article propose un nouveau cadre d’apprentissage discriminant pour l’estimation des modèles continus de traduction. Ce cadre s’appuie sur la définition d’un critère d’optimisation permettant de prendre en compte d’une part la métrique utilisée pour ...
Voir la vidéo
Conférences

le (27m16s)

02a - Utilisation de mesures de confiance pour améliorer le décodage en traduction de parole (taln2015)

Sessions orales TALN 2015 – Mardi 23 juin 2015Session Traduction Utilisation de mesures de confiance pour améliorer le décodage en traduction de parole Laurent Besacier, Benjamin Lecouteux et Luong Ngoc QuangRésumé : Les mesures de confiance au niveau mot (Word Confidence Estimation – WCE) pour la traduction auto- matique (TA) ou pour la reconnaissance automatique de la parole (RAP) attribuent un score de confiance à chaque mot dans une hypothèse de transcription ou de traduction. Dans le passé, l’estimation de ces mesures a le plus souvent été traitée ...
Voir la vidéo
Conférences

le (27m16s)

06b - Attribution d’Auteur : approche multilingue fondée sur les répétitions maximales (taln2015)

Sessions orales TALN 2015 – Mardi 23 juin 2015Session Classification et AlignementAttribution d’Auteur : approche multilingue fondée sur les répétitions maximales Romain Brixtel, Charlotte Lecluze et Gaël Lejeune Résumé : Cet article s’attaque à la tâche d’Attribution d’Auteur en contexte multilingue. Nous proposons une alternative aux méthodes supervisées fondées sur les n-grammes de caractères de longueurs variables : les répétitions maximales. Pour un texte donné, la liste de ses n-grammes de caractères contient des informations redondantes. A contrario, les répétitions maximales représentent l’ensemble des répétitions de ce texte de ...
Voir la vidéo
Conférences

le (27m31s)

05a - Apprentissage par imitation pour l’étiquetage de séquences : vers une formalisation des méthodes d’étiquetage easy-first (taln2015)

Sessions orales TALN 2015 – Mardi 23 juin 2015Session Extraction d’information Apprentissage par imitation pour l’étiquetage de séquences : vers une formalisation des méthodes d’étiquetage easy-first Elena Knyazeva, Guillaume Wisniewski et François Yvon Résumé : Structured learning techniques, aimed at modeling structured objects such as labeled trees or strings, are computationally expensive. Many attempts have been made to reduce their complexity, either to speed up learning et inference, or to take richer dependencies into account. These attempts typically rely on approximate inference techniques and usually provide very little theoretical guarantee regarding the optimality ...
Voir la vidéo
Conférences

le (28m27s)

04b - Analyse syntaxique de l’ancien français : quelles propriétés de la langue influent le plus sur la qualité de l’apprentissage ? (taln2015)

Sessions orales TALN 2015 – Mardi 23 juin 2015Session Syntaxe et paraphraseAnalyse syntaxique de l’ancien français : quelles propriétés de la langue influent le plus sur la qualité de l’apprentissage ? Gaël Guibon, Isabelle Tellier, Sophie Prévost, Matthieu Constant et Kim Gerdes Résumé : L’article présente des résultats d’expériences d’apprentissage automatique pour l’étiquetage morpho-syntaxique et l’analyse syntaxique en dépendance de l’ancien français. Le corpus arboré SRCMF sert de données de référence. La nature peu standardisée de la langue qui y est utilisée implique des données d’entraînement ...
Voir la vidéo

 
FMSH
 
Facebook Twitter
Mon Compte