Apprentissage profond versus apprentissage automatique conventionnel pour la détection des infections associées aux soins dans les récits cliniques français.

Auteurs
Date de publication
2019
Type de publication
Article de journal
Résumé Objectif : L'objectif de cet article était de comparer les performances de détection des infections associées aux soins de santé (IAS) entre les méthodes d'apprentissage profond et d'apprentissage machine (ML) conventionnelles dans les rapports médicaux français. Méthodes : Le corpus était composé de différents types de rapports médicaux (résumés de sortie, rapports de chirurgie, rapports de consultation, etc.) Au total, 1 531 documents textuels médicaux ont été extraits et désidentifiés dans trois hôpitaux universitaires français. Chacun d'entre eux a été étiqueté comme présence (1) ou absence (0) de HAI. Nous avons commencé par normaliser les documents à l'aide d'une liste de techniques de prétraitement. Nous avons calculé une mesure de performance globale, le score F1, pour comparer une méthode d'apprentissage profond (réseau de neurones convolutifs [CNN]) avec les modèles ML conventionnels les plus populaires (Bayes de Bernoulli et multi-naïfs, k-voisins les plus proches, régression logistique, forêts aléatoires, arbres supplémentaires, boosting de gradient, machines à vecteurs de support). Nous avons appliqué l'optimisation bayésienne des hyperparamètres pour chaque modèle en fonction de ses performances en matière d'identification des IAH. Nous avons inclus l'ensemble de la représentation textuelle comme hyperparamètre supplémentaire pour chaque modèle, en utilisant quatre représentations textuelles différentes (sac de mots, fréquence des termes - fréquence inverse des documents, word2vec, et Glove). Résultats : CNN surpasse tous les autres algorithmes ML conventionnels pour la classification HAI. Le meilleur score F1 de 97,7 % ± 3,6 % et le meilleur score de l'aire sous la courbe de 99,8 % ± 0,41 % ont été obtenus lorsque la CNN a été appliquée directement aux notes cliniques traitées sans incorporation word2vec pré-entraînée. Grâce à l'analyse de la courbe caractéristique de fonctionnement du récepteur, nous avons pu atteindre un bon équilibre entre les fausses notifications (avec une spécificité égale à 0,937) et la capacité de détection du système (avec une sensibilité égale à 0,962) en utilisant la référence de l'indice de Youden. Conclusions : Le principal inconvénient des CNN est leur opacité. Pour résoudre ce problème, nous avons étudié les valeurs d'activation des couches internes des CNN afin de visualiser les phrases les plus significatives dans un document. Cette méthode pourrait être utilisée pour construire un algorithme d'assistant médical basé sur les phrases afin d'aider le praticien du contrôle des infections à sélectionner les dossiers médicaux pertinents. Notre étude a démontré que l'approche d'apprentissage profond surpasse les autres algorithmes d'apprentissage de classification pour identifier automatiquement les infections nosocomiales dans les rapports médicaux.
Éditeur
Georg Thieme Verlag KG
Thématiques de la publication
  • ...
  • Pas de thématiques identifiées
Thématiques détectées par scanR à partir des publications retrouvées. Pour plus d’informations, voir https://scanr.enseignementsup-recherche.gouv.fr