Conférence
Notice
Langue :
Français
Crédits
Canal U/3S - CERIMES (Production), Emmanuel Chazard (Intervention)
Conditions d'utilisation
Droit commun de la propriété intellectuelle
DOI : 10.60527/n6e5-x673
Citer cette ressource :
Emmanuel Chazard. Canal-U-Médecine. (2012, 13 mars). ADELF-EMOIS 2012 – Dé-identification automatisée de courriers médicaux : la méthode FASDIM. , in ADELF/EMOIS 2012. [Vidéo]. Canal-U. https://doi.org/10.60527/n6e5-x673. (Consultée le 19 mars 2024)

ADELF-EMOIS 2012 – Dé-identification automatisée de courriers médicaux : la méthode FASDIM.

Réalisation : 13 mars 2012 - Mise en ligne : 27 avril 2012
  • document 1 document 2 document 3
  • niveau 1 niveau 2 niveau 3
Descriptif

Titre : ADELF-EMOIS 2012 – Dé-identification automatisée de courriers médicaux : la méthode FASDIM.Auteurs : Emmanuel Chazard (EA2694, Université Lille Nord de France, France)Capucine Mouret-Kubiak (EA2694, Université Lille Nord de France, France)Grégoire Ficheur (EA2694, Université Lille Nord de France, France)Régis Beuscart (EA2694, Université Lille Nord de France, France)Résumé : IntroductionLes informations contenues dans les courriers médicaux sont importantes pour les projets de recherche. Lorsque l'identification du patient n'est pas indispensable, la confidentialité doit être assurée. Des méthodes de déidentification automatisée fonctionnent en langue anglaise, mais à ce jour aucune méthode n'a obtenu de bon résultat en langue française.MéthodesFASDIM (Fast And Simple Deidentification Method) repose sur plusieurs phases :1- simplification typographique des courriers,2- constitution d'une liste de mots autorisés3- identification des motifs numériques autorisés4- suppression de tous les mots et motifs numériques non autorisésLa liste des mots autorisés est apprise dans l'échantillon, et les liens syntaxiques entre les mots (conjugaison, accord) sont volontairement ignorés pour permettre une indépendance envers la langue. L'évaluation est réalisée sur un corpus de 508 courriers tirés au sort. Les PHI (personal health identifier) désignent les mots directement ou indirectement identifiants, tels un nom, une date, ou un lieu.RésultatsLa méthode FASDIM est maintenant utilisée en routine pour anonymiser la base de plus de 30 000 courriers du projet européen PSIP. FASDIM fournit d'excellents résultats :- 98,1% des PHI disparaissent (rappel ou sensibilité) : 63,7% des termes persistants concernent des lieux, 23% des soignants, 0% des noms.- 89,2% des mots supprimés sont des PHI (précision ou valeur prédictive positive)Les termes supprimés n'altèrent pas la signification médicale du courrier : 99,02% des termes médicaux sont conservés (diagnostic, acte, médicament et posologie, résultat de biologie).Discussion/conclusionFASDIM permet de préserver à la fois la confidentialité du patient et la lisibilité médicale des courriers. Cette méthode est libre de droits, et peut être reproduite en utilisant les informations diffusées sur http://fasdim.products.chazard.orgRecherche financée par la Communauté Européenne, sous l’agrément n°216130-the PSIP project.Mots-clésAnonymisation Confidentialité Dé-identificationL’auteur n’a pas transmis de conflit d’intérêt concernant les données diffusées dans cette vidéo ou publiées dans la référence citée.Conférence enregistrée lors du IIIème Congrès National conjoint ADELF/EMOIS à Dijon les 12 et 13 mars 2012. Session : Systèmes d’informations (Salle Morey Saint-Denis). Modérateurs : F KOHLER, E SAULEAU. Réalisation, production : Canal U/3S - CERIMESMots clés : ADELF, EMOIS, 2012, Dijon, épidémiologie, langue française, évaluation, management, organisation, information, santé, PMSI, Anonymisation, Confidentialité, Dé-identification

Intervention

Dans la même collection

Avec les mêmes intervenants et intervenantes