Conférence
Notice
Langue :
Français
Crédits
Canal-U/Sciences de la Santé et du Sport (Réalisation), CERIMES (Réalisation), Grégoire Ficheur (Intervention)
Conditions d'utilisation
Droit commun de la propriété intellectuelle
DOI : 10.60527/7epv-2v18
Citer cette ressource :
Grégoire Ficheur. Canal-U-Médecine. (2011, 18 mars). EMOIS Nancy 2011 - Codage automatisé : ontologie médicale construite par fouille de textes. , in EMOIS Nancy 2011. [Vidéo]. Canal-U. https://doi.org/10.60527/7epv-2v18. (Consultée le 18 mai 2024)

EMOIS Nancy 2011 - Codage automatisé : ontologie médicale construite par fouille de textes.

Réalisation : 18 mars 2011 - Mise en ligne : 24 mars 2011
  • document 1 document 2 document 3
  • niveau 1 niveau 2 niveau 3
Descriptif

Titre : Codage automatisé : proposition d’une méthode utilisant une ontologie médicale construite par fouille de textes.

Résumé : Le codage automatisé est devenu un enjeu médico-économique majeur.Deux étapes clés peuvent être individualisées parmi les méthodes proposées dans la littérature : une première consiste à fabriquer une terminologie médicale, une seconde à construire une ontologie agrégeant ces termes en concepts par la formalisation de liens logiques. Chacune de ces étapes peut être réalisée à dire d’expert et/ou par fouille de textes.

Nous proposons une méthode entièrement automatisée pour réaliser ces deux étapes, l’ontologie finalement obtenue devant permettre de formaliser une relation simple entre des expressions et le codage selon la 10è Classification Internationale des Maladies (CIM-10).

Méthodes : Nous utilisons des courriers hospitaliers en français (texte libre) issus de 8610 séjours pour lesquels nous disposons également du codage des diagnostics selon la CIM-10. Nous retenons 201 codes différents (codes présents plus de 30 fois). Tout d’abord, nous construisons une terminologie médicale par la recherche de motifs séquentiels au sein des courriers puis un filtre est appliqué.

Ensuite nous réalisons, pour chaque code, une étape de sélection des expressions clés par fouille statistique de données. Nous fixons deux seuils de significativité permettant d’identifier d’une part les synonymes du libellé du code décrit et d’autre part les expressions appartenant à la symptomatologie de la pathologie ainsi codée.

Résultats : Nous obtenons une terminologie comprenant plus de 60 000 expressions médicales. L’étape de fouille statistique de données associe à chaque code 14 synonymes et 45 symptômes (valeurs médianes). Nous disposons notamment des variants orthographiques couramment utilisés dans les courriers hospitaliers.

Discussion/Conclusion : L’ontologie ainsi obtenue et son intérêt dans la construction de règles de prédiction du codage sont évaluées. La généralisation à davantage de diagnostics requiert l’utilisation d’un nombre plus élevé de séjours hospitaliers. Notre méthode n’est dépendante ni de la langue ni de la classification utilisées.

Intervenant : FICHEUR Grégoire (CHRU de Lille, service d’information et des archives médicales, EA2694, Lille, France).

Conférence enregistrée lors des journées EMOIS 2011 à Nancy. Session : systèmes d’informations. Modérateurs : Régis BEUSCART (CHRU de Lille, service d’information et des archives médicales, EA2694, Lille, France) , Sandra GOMEZ (ATIH - Lyon).

Réalisation, production : Canalu U/3S, CERIMES.

SCD Médecine.

Intervention

Dans la même collection

Avec les mêmes intervenants et intervenantes