Conférence
Notice
Langue :
Français
Crédits
Canal U/3S - CERIMES (Production), Emmanuel Chazard (Intervention)
Conditions d'utilisation
Droit commun de la propriété intellectuelle
DOI : 10.60527/n6e5-x673
Citer cette ressource :
Emmanuel Chazard. Canal-U-Médecine. (2012, 13 mars). ADELF-EMOIS 2012 – Dé-identification automatisée de courriers médicaux : la méthode FASDIM. , in ADELF/EMOIS 2012. [Vidéo]. Canal-U. https://doi.org/10.60527/n6e5-x673. (Consultée le 25 avril 2025)

ADELF-EMOIS 2012 – Dé-identification automatisée de courriers médicaux : la méthode FASDIM.

Réalisation : 13 mars 2012 - Mise en ligne : 27 avril 2012
  • document 1 document 2 document 3
  • niveau 1 niveau 2 niveau 3
Descriptif

Titre : ADELF-EMOIS 2012 – Dé-identification automatisée de courriers médicaux : la méthode FASDIM.
Auteurs : Emmanuel Chazard (EA2694, Université Lille Nord de France, France)
Capucine Mouret-Kubiak (EA2694, Université Lille Nord de France, France)
Grégoire Ficheur (EA2694, Université Lille Nord de France, France)
Régis Beuscart (EA2694, Université Lille Nord de France, France)
Résumé : Introduction
Les informations contenues dans les courriers médicaux sont importantes pour les projets de recherche. Lorsque l'identification du patient n'est pas indispensable, la confidentialité doit être assurée. Des méthodes de déidentification automatisée fonctionnent en langue anglaise, mais à ce jour aucune méthode n'a obtenu de bon résultat en langue française.
Méthodes
FASDIM (Fast And Simple Deidentification Method) repose sur plusieurs phases :
1- simplification typographique des courriers,
2- constitution d'une liste de mots autorisés
3- identification des motifs numériques autorisés
4- suppression de tous les mots et motifs numériques non autorisés
La liste des mots autorisés est apprise dans l'échantillon, et les liens syntaxiques entre les mots (conjugaison, accord) sont volontairement ignorés pour permettre une indépendance envers la langue. L'évaluation est réalisée sur un corpus de 508 courriers tirés au sort. Les PHI (personal health identifier) désignent les mots directement ou indirectement identifiants, tels un nom, une date, ou un lieu.
Résultats
La méthode FASDIM est maintenant utilisée en routine pour anonymiser la base de plus de 30 000 courriers du projet européen PSIP. FASDIM fournit d'excellents résultats :
- 98,1% des PHI disparaissent (rappel ou sensibilité) : 63,7% des termes persistants concernent des lieux, 23% des soignants, 0% des noms.
- 89,2% des mots supprimés sont des PHI (précision ou valeur prédictive positive)
Les termes supprimés n'altèrent pas la signification médicale du courrier : 99,02% des termes médicaux sont conservés (diagnostic, acte, médicament et posologie, résultat de biologie).
Discussion/conclusion
FASDIM permet de préserver à la fois la confidentialité du patient et la lisibilité médicale des courriers. Cette méthode est libre de droits, et peut être reproduite en utilisant les informations diffusées sur http://fasdim.products.chazard.org
Recherche financée par la Communauté Européenne, sous l’agrément n°216130-the PSIP project.
Mots-clés
Anonymisation Confidentialité Dé-identification
L’auteur n’a pas transmis de conflit d’intérêt concernant les données diffusées dans cette vidéo ou publiées dans la référence citée.
Conférence enregistrée lors du IIIème Congrès National conjoint ADELF/EMOIS à Dijon les 12 et 13 mars 2012. Session : Systèmes d’informations (Salle Morey Saint-Denis). Modérateurs : F KOHLER, E SAULEAU.
Réalisation, production : Canal U/3S - CERIMES
Mots clés : ADELF, EMOIS, 2012, Dijon, épidémiologie, langue française, évaluation, management, organisation, information, santé, PMSI, Anonymisation, Confidentialité, Dé-identification

Intervention

Dans la même collection

Avec les mêmes intervenants et intervenantes