Évaluation de la portabilité des phénotypes calculables avec traitement automatique du langage naturel dans le réseau eMERGE
Rapports scientifiques volume 13, Numéro d'article : 1971 (2023) Citer cet article
1055 accès
6 Altmétrique
Détails des métriques
Le réseau Electronic Medical Records and Genomics (eMERGE) a évalué la faisabilité du déploiement d'algorithmes portables basés sur des règles de phénotype avec des composants de traitement du langage naturel (NLP) ajoutés pour améliorer les performances des algorithmes existants utilisant des dossiers de santé électroniques (DSE). Sur la base du mérite scientifique et de la difficulté prévue, eMERGE a sélectionné six phénotypes existants à améliorer avec la PNL. Nous avons évalué les performances, la portabilité et la facilité d'utilisation. Nous avons résumé les leçons apprises par : (1) défis ; (2) les meilleures pratiques pour relever les défis sur la base des preuves existantes et/ou de l'expérience d'eMERGE ; et (3) les possibilités de recherches futures. L'ajout de la PNL a entraîné une précision et/ou un rappel améliorés, ou identiques, pour tous les algorithmes sauf un. La portabilité, le flux de travail/processus de phénotypage et la technologie étaient des thèmes majeurs. Avec le NLP, le développement et la validation ont pris plus de temps. Outre la portabilité de la technologie NLP et la réplicabilité des algorithmes, les facteurs de réussite incluent la protection de la vie privée, la configuration de l'infrastructure technique, l'accord de propriété intellectuelle et une communication efficace. Les améliorations du flux de travail peuvent améliorer la communication et réduire le temps de mise en œuvre. Les performances de la PNL variaient principalement en raison de l'hétérogénéité des documents cliniques ; par conséquent, nous vous suggérons d'utiliser des notes semi-structurées, une documentation complète et des options de personnalisation. La portabilité de la PNL est possible avec des performances améliorées de l'algorithme de phénotype, mais une planification et une architecture minutieuses des algorithmes sont essentielles pour prendre en charge les personnalisations locales.
L'extraction précise d'informations phénotypiques complètes et détaillées à partir de données à grande échelle de dossiers de santé électroniques (DSE) améliore l'efficacité et la précision de la recherche en médecine de précision. Cependant, les données structurées seules sont souvent insuffisantes pour identifier ou décrire pleinement de nombreuses conditions, en particulier lorsqu'un attribut n'est pas couramment facturé ou nécessite une interprétation nuancée1,2,3,4. Le traitement du langage naturel (NLP) et l'apprentissage automatique (ML) promettent de permettre un phénotypage approfondi à l'aide de récits EHR nuancés5,6,7,8.
Les deux pipelines NLP sophistiqués, tels que MedLEE9, CLAMP10, cTAKES11 et MetaMap12,13 ; et des approches basées sur des règles plus simples combinant des expressions régulières (RegEx) et la logique ; sont de plus en plus utilisées pour le phénotypage profond14. Cependant, il est difficile d'atteindre une large généralisabilité et la portabilité de l'algorithme de phénotype étant donné les systèmes de DSE disparates et les approches de documentation hétérogènes utilisées par les cliniciens15. Par exemple, Sohn et al. ont rapporté comment les variations dans la documentation clinique liée à l'asthme entre deux cohortes affectent la portabilité du système PNL16. De plus, les types de documents et les structures varient selon les DSE, et certains sites ont plus de données non structurées que d'autres. Les abréviations, les terminologies et l'utilisation d'autres langues varient également selon les sites, les cliniciens et le temps. Par exemple, Adekkanattu et al. ont signalé une variabilité des performances du système due à l'hétérogénéité des formats de texte locaux et des termes lexicaux utilisés pour documenter divers concepts, dans trois institutions différentes évaluant la portabilité d'un système spécialisé d'extraction d'informations d'échocardiographie17.
La communauté biomédicale de la PNL a développé un certain nombre d'approches pour résoudre ces problèmes, notamment la mesure de la similarité sémantique du texte, le déploiement de systèmes de PNL d'ensemble, l'utilisation de dictionnaires de termes complets et la conversion de texte en normes de données, telles que Fast Health Interoperability Resources (FHIR) et le modèle de données commun (CDM) de l'Observational Medical Outcomes Partnership (OMOP)18. Plus précisément, Liu et al.19 ont démontré que des ensembles de systèmes PNL peuvent améliorer la portabilité grâce à la fois à la reconnaissance de concepts phénotypiques génériques et à l'identification de concepts phénotypiques spécifiques au patient sur des systèmes individuels. De plus, Jiang et al. ont tiré parti de la norme FHIR pour développer un pipeline évolutif de normalisation des données qui intègre à la fois des données cliniques structurées et non structurées pour le phénotypage20. Enfin, Sharma et al. a développé un système PNL portable en extrayant des concepts de phénotype, en les normalisant à l'aide du système de langage médical unifié (UMLS) et en les mappant sur l'OMOP CDM21.
Le réseau eMERGE (electronic MEdical Records and GEnomics) a été organisé et financé par le National Human Genomic Research Institute (NHGRI) en 2007 pour étudier l'intersection de la génomique et des DSE22,23,24,25,26. L'une des contributions les plus durables du réseau est le développement de phénotypes calculables pour identifier les maladies courantes dans les DSE pour la recherche génétique. Chaque algorithme de phénotype est validé sur plusieurs sites et est accessible au public dans la Phenotype KnowledgeBase (PheKB.org)27. Au cours des quatorze dernières années, le réseau eMERGE a accumulé une expérience considérable dans le développement, la validation et la mise en œuvre d'algorithmes de phénotypage17,22,23,24,25,28,29,30,31,32. Cette collaboration entre plusieurs institutions participantes offre de rares opportunités d'explorer les performances et la portabilité de la PNL pour les « mégadonnées » dans les DSE dans divers contextes. Une tâche critique en cours reste l'identification du manque de connaissances des meilleures pratiques dans le développement, la validation et la mise en œuvre d'algorithmes de phénotype portables utilisant la PNL.
L'un des objectifs de la phase III du réseau eMERGE (2015-2020) était d'intégrer la PNL/ML dans les algorithmes de phénotype eMERGE existants pour améliorer leurs performances et/ou mieux déterminer les sous-phénotypes. À cette fin, en 2019-2020, une étude pilote d'un an a été menée pour tester la faisabilité du déploiement d'algorithmes de phénotype portables incorporant des composants NLP dans les algorithmes de phénotype basés sur des règles existants. Plus précisément, nous avons cherché à utiliser la PNL pour identifier les sous-populations et améliorer les algorithmes de phénotype existants. Comme nous identifions des cas (et aussi parfois des témoins) pour la recherche génétique, il est important d'avoir le plus grand nombre possible de patients (cas) identifiés avec précision avec le phénotype donné. Ainsi, l'amélioration a été définie comme soit un rappel amélioré, pour augmenter le nombre de cas ; et/ou une précision améliorée pour identifier correctement un pourcentage plus élevé de cas réels. Nous avons émis l'hypothèse que le développement d'outils TAL portables, précis et efficaces pour une application multi-sites dépend de la disponibilité de ressources humaines et technologiques intra et inter-sites, en raison d'expériences de terrain très variables, y compris entre nos sites. Ceux-ci doivent être capables d'exposer et de traiter les diverses sources d'hétérogénéité, telles que différents environnements, qui ont un impact sur la capacité d'un système NLP à extraire avec précision des informations. En réfléchissant à ce travail d'eMERGE, l'objectif de cet article est de : (1) signaler les défis auxquels nous avons été confrontés lors de la mise en œuvre des algorithmes de phénotype eMERGE avec des composants NLP/ML ajoutés et, (2) recommander les meilleures pratiques que nous avons rencontrées et/ou trouvées lors de l'examen, pour aider les autres à surmonter ces défis, afin de mettre en œuvre des algorithmes de phénotype portables, en particulier ceux avec des composants NLP/ML.
Afin d'atteindre ces objectifs, un sous-groupe de travail PNL du groupe de travail eMERGE sur le phénotypage a été formé. ). Sur la base du mérite scientifique et de la difficulté prévue, le groupe a sélectionné six phénotypes avec des algorithmes de phénotype calculables existants à améliorer avec la PNL : rhinosinusite chronique (CRS)33, traits d'électrocardiogramme (ECG)34, lupus érythémateux disséminé (SLE)35, chevauchement asthme/maladie pulmonaire obstructive chronique (MPOC)36, hypercholestérolémie familiale (FH)37 et dermatite atopique (AD )38. Tous les algorithmes étaient des algorithmes cas-témoin ; plus précisément, les cas étaient des patients avec et des témoins sans le phénotype, tel que défini par chaque algorithme. Les sous-phénotypes comprenaient des traits sur les rapports ECG tels que le syndrome de Brugada, le SRC avec et sans polypes nasaux et les sous-types de LED et de MA.
Pour réduire l'hétérogénéité des études afin de tenir compte des contraintes de temps et de réduire les obstacles à la mise en œuvre par les cliniciens ayant une formation minimale en PNL, nous avons limité les pipelines de PNL à ceux avec lesquels nous avions de l'expérience39,40,41,42,43,44, et qui reflétaient raisonnablement la variété des outils de PNL actuellement utilisés dans les établissements de santé, comme le montre une revue récente45. À cette fin, la sélection des plates-formes NLP a été basée sur une enquête sur les plates-formes que les sites avaient le plus d'expérience dans l'utilisation. Les outils sélectionnés étaient : cTAKES11, MetaMap12,13 et/ou des expressions régulières (RegEx), ainsi que deux modules de détection de négation couramment adoptés : NegEx et ConText46,47, qui sont basés sur des règles. Les algorithmes de phénotype AD et COPD/ACO modifiés avaient également des composants ML, pour lesquels un code personnalisé écrit en Python et Java a été utilisé, respectivement. Les phénotypes, ainsi que les objectifs et les outils sélectionnés, sont présentés dans le tableau 1, et plus de détails sur les algorithmes sont disponibles sur PheKB.org27.
Pour valider les algorithmes de phénotype en fonction de nos objectifs, nous nous sommes concentrés sur la validation si les patients étaient correctement identifiés comme cas (et/ou témoins) par les algorithmes de phénotype originaux et nouveaux améliorés par la PNL. Les algorithmes originaux ont été préalablement validés33,34,35,36,37,38. Ensuite, pour cette étude, le site "lead" (primaire) a ajouté des composants PNL à l'algorithme d'origine, qu'il avait précédemment dirigé (à une exception près, AD, qui était auparavant dirigé par un site pédiatrique, mais dans ce projet pilote était dirigé par un site axé sur les adultes). Ensuite, le site principal a validé l'algorithme de phénotype amélioré par NLP/ML, via l'examen manuel des dossiers de sous-ensembles sélectionnés au hasard : des dossiers de patients et, au besoin, des notes cliniques pour ces patients. Ensuite, comme cela est typique dans le développement d'algorithmes de phénotype eMERGE23, le site principal a travaillé avec au moins un site de "validation" (secondaire) pour ajuster davantage les algorithmes selon les besoins, jusqu'à ce qu'une précision et un rappel satisfaisants soient obtenus, calculés via les revues manuelles. Plus précisément, les procédures de validation des algorithmes de phénotype du réseau eMERGE23, qui ont été utilisées ici, impliquent des sites ayant des cliniciens expérimentés dans le diagnostic et le traitement du phénotype donné, ou des professionnels de la santé hautement qualifiés, pour vérifier la présence ou l'absence du phénotype dans l'ensemble du dossier de santé du patient (pas seulement le texte clinique), et si nécessaire ses caractéristiques détaillées, telles que les signes et les symptômes. Comme c'est également typique au sein d'eMERGE, si possible, au moins 2 personnes ont examiné les graphiques et ont également examiné au moins quelques-uns des mêmes graphiques au début pour assurer la fiabilité inter-évaluateurs, tandis qu'une personne plus expérimentée statue sur les différences si possible ; ou, s'il n'y a qu'un seul examinateur, la personne est un expert du phénotype. Par exemple, pour le développement du phénotype ACO, 2 pneumologues ont revu et un 3e pneumologue a réconcilié des étiquettes discordantes ; tandis que chez KPWA pour le même phénotype, les examens des dossiers ont été effectués par un abstracteur de dossiers professionnel non clinicien ayant accès à un clinicien MD pour aider l'abstracteur à résoudre toutes les questions/préoccupations qui dépassaient les compétences des abstracteurs. De même, chez Mayo et Geisinger, un seul médecin a examiné les dossiers et au VUMC, un cardiologue senior a examiné tous les rapports ECG et pour le SLE, un rhumatologue effectuant des recherches sur le SLE a fait cet examen. Un site principal examine environ 50 dossiers de patients et au moins un site de validation (secondaire) examine ensuite environ 25 dossiers : le nombre de dossiers examinés est parfois plus élevé selon le phénotype23,24,25,26,27, qui s'est produit dans cette étude. Si l'algorithme de phénotype sert à identifier à la fois les cas et les témoins, alors le nombre total de dossiers examinés comprend les deux (par exemple, environ 25 cas potentiels et 25 témoins potentiels lorsque le total est de 50 dossiers examinés)23,24,25,26,27, comme on le voit pour plusieurs phénotypes dans cette étude. Enfin, les algorithmes de phénotype ont été diffusés à tous les sites participants pour être mis en œuvre et améliorés de manière itérative selon les besoins en fonction des commentaires des sites de mise en œuvre. Les statistiques de précision finales ont été recalculées, si nécessaire, après que toutes les modifications ont été apportées pour le rapport ici.
Nous avons ensuite comparé rétrospectivement les méthodes et outils de PNL pour évaluer les performances, la portabilité et la facilité d'utilisation. Pour ce faire, nous avons demandé aux sites de rapporter leurs leçons apprises pour la création et le partage d'algorithmes NLP/ML via une brève enquête informelle sur chaque algorithme de phénotype qu'ils ont développé, validé et/ou mis en œuvre (les questions posées sont répertoriées dans l'annexe supplémentaire A). Quantitativement, les sites ont été invités à signaler les performances (en particulier le rappel et la précision) sur les sites de validation principaux et (secondaires), pour les algorithmes de phénotype d'origine et modifiés (NLP ajouté). Les sites ont également été invités à estimer la quantité de ressources et le temps nécessaires pour terminer le développement, la validation et la mise en œuvre. Ces estimations étaient basées sur des approximations après l'achèvement des travaux. De plus, étant donné que le personnel ne consacrait généralement pas 100 % de son temps aux algorithmes, les estimations de temps sont variables car elles dépendent de la proportion d'effort. En outre, certains sites ont éventuellement séparé l'expertise des personnes nécessaires pour effectuer la tâche (par exemple, les analystes cliniques, informatiques et EHR). Les ressources physiques ont été signalées comme le nombre de serveurs nécessaires pour interroger les données et/ou exécuter les algorithmes. Sur le plan qualitatif, les sites ont été invités à indiquer à quel point ils estimaient que chaque algorithme était difficile à mettre en œuvre ; sa portabilité, y compris les personnalisations locales nécessaires à l'exécution de l'algorithme ; et tout autre problème identifié par les sites lors du partage, y compris les problèmes techniques ou de performances. Des commentaires qualitatifs supplémentaires sur l'expérience ont été recueillis de manière informelle lors des réunions mensuelles du groupe de travail et à partir de courriels directs des sites.
En utilisant la théorie ancrée48, une analyse thématique a été menée par deux auteurs (JAP, LVR) via une revue indépendante de tous les retours qualitatifs. Tout d'abord, un codage ouvert et axial sur les catégories de problèmes ou de préoccupations a été effectué pour identifier les phrases clés et les catégoriser de manière approximative. Les codeurs ont utilisé un codage sélectif pour affiner les codes axiaux dans un livre de codes hiérarchique complet, ont recodé indépendamment les commentaires et les ont examinés pour parvenir à un consensus. Les thèmes émergents ont été identifiés grâce à un examen itératif des codes. Ensuite, nous avons préparé un examen et un résumé des leçons apprises, y compris (a) les défis pour chaque thème ; (b) les meilleures pratiques correspondantes pour relever ces défis sur la base des preuves publiées existantes et/ou de l'expérience du réseau eMERGE ; et (c) le cas échéant, les possibilités de recherches futures. Enfin, pour évaluer la crédibilité, les résultats ont été présentés aux co-auteurs, puis les leçons et les recommandations ont été affinées au besoin.
Le consentement éclairé a été obtenu de tous les sujets impliqués dans l'étude par l'Institutional Review Board (IRB) de chaque site. La recherche a été effectuée conformément aux directives et réglementations pertinentes pour l'utilisation des données biomédicales des participants humains, y compris celles des protocoles IRB approuvés de chaque site, et conformément à la Déclaration d'Helsinki.
Pour chaque algorithme de phénotype, le tableau 2 présente les statistiques de précision et le personnel requis. Bien que non signalés par tous les sites, les rôles du personnel impliqué comprenaient des programmeurs, des cliniciens et des linguistes informatiques. Bien que la plupart des sites aient examiné 50 à 100 dossiers de patients, comme c'est le cas dans eMERGE pour la validation des algorithmes de phénotype, la fourchette variait : les sites principaux ont examiné de 46 à 972 dossiers, avec une médiane de 100 dossiers examinés, et les sites de validation ont examiné 50 à 950 dossiers, avec une médiane de 65 dossiers examinés. D'après ces examens des dossiers des patients, pour tous les algorithmes sauf un (LES, où la précision globale a diminué), la précision et le rappel sont globalement restés inchangés ou améliorés aux sites de validation principal (primaire) et (secondaire). Les changements dans les statistiques de précision pour les sous-phénotypes variaient entre les sous-phénotypes et les sites de développement et de validation. Les différences dans les performances de l'algorithme de phénotype n'étaient pas associées aux outils utilisés. Seuls deux sites ont noté le nombre d'enregistrements dans le DSE (contenant à la fois du texte clinique et des données discrètes telles que des laboratoires) qui ont été utilisés, et pour la mise en œuvre de l'algorithme de phénotype amélioré NLP/ML final : pour l'algorithme ECG, il a été noté qu'un peu plus d'un million d'enregistrements ECG du DSE ont été utilisés dans la mise en œuvre de VUMC ; pour l'algorithme SLE, 185 838 notes ont été traitées à partir de 4 468 patients pour la mise en œuvre de VUMC ; et pour l'algorithme AD, 4 094 notes, laboratoires et/ou codes de patients ont été examinés pour la mise en œuvre d'un autre site.
Enfin, le temps de développement et de validation (y compris l'examen des graphiques) par les sites principaux et de validation était considérablement plus long que la mise en œuvre ultérieure par d'autres sites ; plus précisément, 6 mois ou plus pour le développement et la validation, contre seulement quelques semaines pour la mise en œuvre. Par exemple, l'ECG a mis 11 mois à se développer et à être validé, mais les sites n'ont pris qu'entre 1 et 3 semaines pour la mise en œuvre. De plus, les sites ont signalé que 1 à 2 serveurs étaient nécessaires pour exécuter les algorithmes, bien qu'aucun détail supplémentaire n'ait été fourni sur la configuration du serveur.
La figure 1 montre les trois principaux thèmes identifiés à partir de l'analyse qualitative : la portabilité, le flux de travail/processus de phénotypage et la technologie. Le thème de la technologie s'est avéré être un modificateur pour les deux autres thèmes principaux, car toutes les technologies étaient associées à un autre thème. Cette approche a été utilisée pour la phase d'analyse et de synthèse afin d'identifier les thèmes récurrents fortement associés à une ou plusieurs technologies. Chacun des thèmes est résumé dans le tableau 3, avec le livre de codes complet disponible dans l'annexe supplémentaire B.
Il y avait 3 thèmes qui se chevauchaient (portabilité, flux de travail/processus de phénotypage et (utilisation de) la technologie). Pour chaque thème, les sous-thèmes sont présentés dans des encadrés avec d'autres sous-thèmes dans chaque encadré répertoriés sous forme de puces. Pour chaque leçon, si une technologie était mentionnée comme étant utilisée, mais qu'il n'y avait aucun problème avec la technologie elle-même, l'utilisation de la technologie était simplement notée.
Quelques sous-thèmes communs ont été identifiés, notamment la portabilité et l'utilisation de différentes technologies. Le filtrage des données était également important, à la fois pour une sélection appropriée de l'algorithme et des filtres appropriés pour réduire la quantité de données afin d'améliorer les performances du logiciel. Un autre sous-thème important était le besoin de ressources humaines, à la fois le besoin de membres de l'équipe possédant des compétences spécialisées pour aider à la portabilité de la technologie et le besoin de membres de l'équipe de bien communiquer.
Les considérations concernant la portabilité des algorithmes de phénotype ont été divisées en deux sous-thèmes. Le premier thème était la portabilité de l'algorithme : comment l'algorithme ML et/ou NLP fonctionnait sur des sites autres que le site principal. Cela a renforcé les observations établies selon lesquelles les performances de l'algorithme peuvent différer selon le phénotype. Par exemple, pour la dermatite atopique, sur un site de validation (secondaire), de nombreux enregistrements dermatologiques pertinents ont été capturés sur papier, à partir desquels le texte n'a pas été converti en format analysable dans le DSE, ainsi, l'algorithme basé sur le DSE avait un nombre élevé de résultats faux négatifs.
Le format, la composition et la classification des documents sur différents sites ont également joué un rôle dans la portabilité des algorithmes, y compris les formats des notes cliniques. Il s'agissait d'un problème pour tous les types de notes utilisées, qui comprenaient l'ECG et d'autres rapports de procédure et de laboratoire, ainsi que les notes de rencontre/visite au bureau/à la clinique. Plus souvent, les sites ont décrit des difficultés à identifier les bons documents à traiter avec le NLP. Par exemple, l'algorithme de phénotype nécessiterait des "notes de radiologie", mais aucun regroupement sémantique a priori n'était facilement disponible sur chaque site de mise en œuvre pour identifier de grandes catégories de notes telles que l'imagerie, la pathologie et la microbiologie. Au lieu de cela, les sites devaient examiner et mapper les types de documents locaux aux types de documents spécifiés dans l'algorithme. Des problèmes similaires se sont produits pour les spécialités/départements médicaux auxquels les notes étaient associées, ainsi que pour les sections spécifiques des notes. Un examen manuel était souvent nécessaire pour résoudre ces problèmes. Une découverte inattendue a été que l'inclusion de matériel éducatif général pour les patients dans les notes cliniques a également eu un impact négatif sur les performances de certains sites.
Enfin, les sites ont reconnu que des défis bien connus au sein du NLP et du ML persistaient. Le défi le plus répandu était la négation : la tâche de déduire du contexte d'un terme ou d'une phrase quand il n'était pas présent ou vrai. Nous avons observé plusieurs composants PNL subir des pertes de performances parce que les modules n'ont pas réussi à capturer correctement certaines instances de négation, par exemple "la fibrillation/le flutter auriculaire n'est plus présent" a été faussement identifié comme un cas. La détection précise de la négation peut être difficile quelles que soient les technologies NLP utilisées49. En plus de la négation, l'utilisation de la langue et le formatage des documents peuvent varier selon l'établissement ou même entre les spécialités d'un même établissement, ce qui a affecté les performances de la PNL. Un exemple était l'utilisation des deux-points comme séparateur dans le texte, qui était interprété sur certains sites comme un terminateur et sur d'autres comme le début d'une liste. L'incertitude diagnostique (lorsque le texte indique que le diagnostic n'est pas clair) et les termes rares étaient des caractéristiques linguistiques également signalées comme des problèmes, bien que nous notions qu'il n'existe peut-être pas de solutions PNL pour atténuer la première.
Le deuxième sous-thème identifié concernant la portabilité était centré sur l'exécution du code de l'algorithme, en particulier sur l'exécution du logiciel NLP/ML. Bien que la PNL ait été limitée à deux systèmes (cTAKES et MetaMap), la configuration et l'exécution de ces systèmes dans différents environnements informatiques (par exemple, différents systèmes d'exploitation) ont présenté des défis. De plus, aucune restriction n'a été imposée aux langages de programmation utilisés pour le ML et aux composants basés sur des règles de l'algorithme de phénotype dans son ensemble. Les sites ont noté que certains langages de programmation (par exemple Ruby) n'étaient pas largement utilisés dans les établissements. Pour certaines institutions, cela signifiait que la langue n'était pas prise en charge et que, par conséquent, le code de l'algorithme ne pouvait pas être exécuté. Pour d'autres, la langue n'était pas la langue préférée et des experts locaux ont dû être trouvés pour aider à l'exécution. Cela a fait apparaître deux thèmes supplémentaires pour les «besoins en ressources» : des environnements de serveur dédiés pour exécuter le NLP / ML et un personnel spécialisé - le plus souvent quelqu'un ayant de l'expérience en NLP.
Indépendamment de la familiarité des sites avec un système NLP ou un langage de programmation, ils avaient souvent besoin de modifier le code de l'algorithme avant qu'il ne s'exécute localement ("Personnalisation/Localisation"). Ces modifications étaient généralement mineures, telles que la modification des chemins d'accès aux fichiers dans les formats d'entrée de code et de document. D'autres changements comprenaient des étapes de prétraitement distinctes pour le texte clinique, une solution technique aux problèmes généraux notés dans le sous-thème « Hétérogénéité des données entre les sites ».
Une autre différence notée entre les sites était la "Performance (Vitesse)" car elle concerne à la fois le temps total écoulé pour que NLP/ML s'exécute et le temps d'exécution réel. Les sites ont noté que les étapes de préparation des données étaient généralement les plus exigeantes en main-d'œuvre et que le temps nécessaire variait considérablement d'un site à l'autre. Le temps d'exécution variait en fonction des ressources informatiques et du volume d'informations textuelles disponibles. Avec un traitement de texte gourmand en mémoire, un site a noté qu'un algorithme NLP déployé en tant que notebook Jupyter sur un PC aux ressources limitées prenait "> 2 h pour s'exécuter", en réponse à quoi le site a extrait le code Python et déployé directement sur le serveur avec une mémoire et un espace disque augmentés. Le filtrage des notes était un thème répandu lié à la performance. Certains algorithmes NLP tels que déployés traiteraient toutes les notes cliniques, ce qui, sur certains sites, n'était pas réalisable en raison du très grand nombre de notes sur ces sites, qui, au moins sur 1 site, dépassaient 1 million de notes, même après filtrage. Pour résoudre ce problème, les sites ont appliqué des filtres soit en présélectionnant les patients pour lesquels traiter les notes, soit en se limitant aux types de notes cliniques appropriées à traiter. La présélection/filtrage des patients était très large, comme la sélection de tous les patients qui avaient un code de diagnostic pour ou lié au phénotype donné.
Les sites ont également noté comment l'utilisation de plusieurs technologies ("environnements hétérogènes") empêchait la portabilité. Comme indiqué précédemment, selon la technologie, des spécialistes locaux étaient nécessaires. Trouver et coordonner la disponibilité de ces personnes a augmenté le temps total de mise en œuvre écoulé sur certains sites. Sur plusieurs technologies, ou parfois même en utilisant la même technologie, l'algorithme a été implémenté sous forme de scripts ou de programmes disjoints ("Manque d'intégration"). Les sites ont indiqué qu'ils devraient exécuter chacune de ces étapes séparément, ce qui allongeait également le temps total de mise en œuvre.
Des thèmes supplémentaires liés à la mise en œuvre du logiciel ont également été notés par les sites, notamment le manque de vérification des conditions aux limites qui a provoqué le blocage du logiciel. Cela incluait des éléments tels que des entrées nulles/vides/mal formatées inattendues. Cela a également augmenté les retards dans la mise en œuvre, car il fallait du temps pour dépanner et résoudre le problème.
Les sites ont signalé que parce que les notes cliniques contiennent souvent des identifiants de patients, des mesures supplémentaires ont dû être prises pour assurer la confidentialité des patients. Un site a nécessité des approbations supplémentaires pour accéder aux notes cliniques afin d'exécuter la PNL. Un autre site a observé qu'en exécutant le PNL localement et en distribuant les sorties/résultats finaux, ils ont évité les complications liées au partage de notes cliniques entières avec l'auteur de l'algorithme. Par conséquent, en ne partageant que les résultats, cela a permis aux sites et au réseau de conserver des données anonymisées, tout en permettant une recherche plus approfondie dans les DSE de chaque établissement.
Un manque de documentation traversait à la fois les thèmes techniques et algorithmiques. Les sites ont noté qu'une documentation et des instructions suffisantes n'étaient pas toujours disponibles sur la façon d'exécuter l'algorithme de phénotype. De plus, une documentation insuffisante sur la fonction prévue d'un algorithme, ou l'entrée exacte nécessaire, a compliqué la mise en œuvre. Pour ces derniers, les sites auraient parfois besoin de lire le code lui-même, qui manquait également de documentation et/ou de commentaires suffisants.
Au cours du processus de mise en œuvre, les sites ont noté des retards liés à des problèmes de communication. Par exemple, le manque de documentation inciterait un site à demander plus d'informations. En attendant une réponse, un site peut avoir été obligé de déplacer l'attention de l'algorithme de phénotype vers un autre projet, provoquant un autre délai avant que le site ne puisse revenir en arrière.
Un site a noté des retards dans la mise en œuvre et la diffusion en raison de problèmes de propriété intellectuelle (PI) dans son établissement. Étant donné que le NLP et le ML nécessitent généralement des investissements importants en ressources, un système développé en interne sur ce site a été considéré comme une propriété intellectuelle protégée. Le site a travaillé pour établir une version de l'algorithme NLP qui pourrait être partagée entre les sites. Le temps considérable requis pour effectuer l'examen et obtenir les approbations a retardé le calendrier global de mise en œuvre.
Un ajustement du processus de phénotypage a également inclus le code de portage/réécriture, qui a pris deux formes. La première était spécifique à cette étude et motivée par la décision du réseau de limiter les pipelines NLP qui seraient utilisés. Un site avait un pipeline NLP préexistant qui n'était pas l'un de ceux choisis ; en conséquence, le site a dû porter l'algorithme NLP sur cTAKES. Des problèmes ont été identifiés dans la version portée de l'algorithme, qui ont nécessité une correction. La deuxième forme de portage était motivée par des besoins, des exigences ou des préférences spécifiques au site pour refactoriser ou réécrire l'algorithme fourni. Par exemple, un site a réécrit une implémentation Ruby RegEx en Python.
Dans l'ensemble, le réseau a identifié le besoin et proposé un nouveau flux de travail de phénotypage pour guider le développement et améliorer le processus de validation (Fig. 2), en particulier, mais sans s'y limiter, les algorithmes NLP/ML. Dans le flux de travail préexistant23, la validation des algorithmes par le site secondaire n'a commencé qu'après qu'un site principal (principal) s'est développé et a ensuite validé un algorithme. Par conséquent, la première amélioration du flux de travail est le développement d'un algorithme sur le site principal à effectuer en parallèle avec la création d'une cohorte de validation "gold standard" par examen des dossiers médicaux sur les sites de validation principaux et (secondaires), en particulier pour les algorithmes NLP/ML qui nécessitent des ensembles de formation afin de développer l'algorithme. Cela nécessite de filtrer le DSE au début du flux de travail pour une cohorte définie à partir de laquelle les ensembles de formation et de validation des patients sont choisis. Par exemple, un dépistage pourrait être au moins un code de la Classification internationale des maladies (CIM)-9/CIM-10 pour ce phénotype en tant que filtre très sensible. Par conséquent, la sélection d'un échantillon aléatoire à partir d'une population enrichie pour ce phénotype facilite une prévalence raisonnable, généralement de l'ordre de 20 à 80 %. À partir de ce processus, chaque site peut sélectionner un échantillon aléatoire de peut-être 100 à 200 patients que les cliniciens classent comme cas positifs ou négatifs, ou indéterminés, pour un objectif d'au moins 50 cas confirmés dans chaque ensemble de données de référence. L'algorithme développé dans le jeu de données principal peut être testé dans le jeu de données secondaire ; par conséquent, si les mesures de performance sont médiocres, l'algorithme peut être révisé et testé dans les ensembles de données des deux sites, sans examen supplémentaire du dossier médical. Ainsi, les sites principaux (création de phénotypes) subiront moins de pression inhérente pour produire un algorithme "parfait" comme condition préalable à la diffusion sur des sites de validation (secondaires), accélérant le processus de développement de l'algorithme.
Organigramme du flux de travail proposé pour le développement, la validation et la mise en œuvre d'algorithmes de phénotype calculables portables dans eMERGE. Le flux de travail proposé a été adapté d'un flux de travail précédemment publié par Newton et al. au nom d'eMERGE23.
Nous avons tiré parti des ressources uniques du réseau eMERGE pour évaluer les avantages et les défis de l'intégration de la PNL dans des phénotypes informatiques portables. Les avantages de la PNL comprennent : l'amélioration de la sensibilité (SLE et ACO) pour identifier davantage de cas d'une maladie plus rare ; précision accrue (CRS), une considération importante dans des conditions plus courantes ; et permettre un phénotypage approfondi, tel que l'extraction de sous-phénotypes à partir de notes ECG. En général, les performances de l'algorithme sur les sites principaux et de validation ont été améliorées avec l'ajout de la PNL portable. De même, la mise en œuvre d'un algorithme de phénotypage portable et calculable, pour identifier les patients pour le recrutement des essais cliniques, a ajouté la PNL à leur algorithme, améliorant le rappel et la précision de l'algorithme26.
Les performances du PNL peuvent varier d'un site à l'autre, en raison de l'hétérogénéité des noms de documents cliniques et de la structure de base des notes cliniques. Idéalement, la mise en œuvre d'une terminologie normalisée (par exemple LOINC Document Ontology) sur tous les sites pourrait fournir des descriptions d'entrée explicites et réduire les incohérences18. Cependant, la mise en œuvre de ces terminologies standard n'est pas pratique en raison de l'absence de critères de sélection clairs actuellement. Le processus global pourrait être coûteux, long et difficile à modifier lorsque les preuves disponibles sont insuffisantes pour guider la sélection. De plus, même si tous les sites adoptent la même terminologie et le même CDM pour les notes cliniques, car les notes peuvent varier dans leurs modèles locaux, les modèles de documentation, la qualité des documents (c'est-à-dire les fautes d'orthographe et les fautes de frappe), la qualité globale des données du DSE et les sous-langues ; la portabilité est toujours difficile16,26. Ainsi, nous suggérons de commencer par des notes cliniques semi-structurées (par exemple, des listes de problèmes/médicaments) : par exemple, des études récentes ont démontré les avantages de l'utilisation de listes d'allergies pour les études cliniques50,51.
Notamment, la généralisabilité des modules de négation reste un défi ouvert de la PNL, et est cohérent avec d'autres rapports49,52. Une adaptation locale de la négation peut être nécessaire, comme l'ajout de règles de correction au code pour la négation du langage. De plus, les erreurs dans le code logiciel étaient une autre source potentielle de performances d'algorithme différentes entre les sites. L'utilisation de systèmes de contrôle de version collaboratifs formels (tels que GitHub) doit être privilégiée par rapport à d'autres moyens moins efficaces tels que les distributions de code et de documentation par e-mail. Pour cette raison et d'autres déjà mentionnées, la portabilité peut être encore améliorée en demandant aux institutions d'améliorer les processus de développement, de fournir une documentation complète et des options de personnalisation.
Partager et mettre en œuvre avec succès un phénotype calculable à l'aide de la PNL ne concerne pas seulement la technologie de la PNL ou l'algorithme lui-même. D'autres facteurs critiques incluent la protection de la vie privée, la configuration de l'infrastructure technique, l'accord de propriété intellectuelle et une communication efficace. Par exemple, comme les notes cliniques ne peuvent pas toujours être anonymisées, les sites peuvent ne pas être en mesure d'échanger des exemples de notes, ce qui entraîne des difficultés pour la validation intersite. Les avancées récentes sur le réseau antagoniste génératif de protection de la vie privée peuvent générer de fausses données textuelles avec une similitude de structure conservée qui peuvent être utilisées pour le développement et la validation d'algorithmes NLP53. Des approches d'apprentissage fédéré ont également émergé pour préserver la confidentialité sans avoir à transporter de texte clinique54. Il a été démontré que le formatage des informations intégrées dans les notes (par exemple, Rich Text Format [RTF]) améliore les résultats de phénotypage55 ; cependant, l'utilisation intersite des informations de format est utilisée de manière incohérente sur le réseau eMERGE. Les défis d'infrastructure peuvent être améliorés par le cloud computing dans lequel les algorithmes et les flux de travail de données peuvent être préemballés et utilisés par des chercheurs peu formés55,56 ; cependant, les institutions peuvent ne pas être à l'aise de mettre des informations de santé protégées (PHI) dans un cloud partageable. Bien que cela n'ait pas été explicitement testé dans ce travail, nous pensons également que l'indexation en texte intégral de toutes les notes cliniques au début accélérerait le temps d'exécution et réduirait les besoins en infrastructure en réduisant les notes à traiter avec un système NLP basé sur des règles.
Enfin, une communication efficiente et efficace entre les sites est essentielle. Notre approche traditionnelle (c'est-à-dire la communication via des commentaires sur PheKB.org) peut ne pas convenir à une communication opportune, itérative et bidirectionnelle. De plus, comme d'autres l'ont également noté, la collaboration entre les sites et aussi entre les différents types d'experts (c.-à-d. cliniciens, informaticiens, etc.) nécessaires est essentielle23,27,29. De plus, développer une « métrique de simplicité » pour caractériser les algorithmes de phénotypage permettrait aux chercheurs de déterminer plus facilement les compétences nécessaires à la mise en œuvre. Par exemple, les types de données requis par l'algorithme pourraient être classés par ordre de simplicité d'extraction du DSE.
Il y a quelques limites à cette étude. Premièrement, la comparaison des performances à l'aide de pipelines NLP autres que MetaMap ou cTAKES, tels que CLAMP, dépassait nos ressources et notre calendrier. Notre approche de la sélection des plates-formes NLP était basée sur celles avec lesquelles nous avions le plus d'expérience, ce qui n'est pas nécessairement basé sur les forces ou les capacités de la plate-forme elle-même. Bien que l'avantage de notre approche soit que les résultats sont probablement plus généralisables aux organisations souhaitant mettre en œuvre un phénotypage amélioré en PNL, parfois par des cliniciens ayant une formation minimale en PNL ; l'inconvénient est qu'il empêchait d'utiliser les approches NLP les plus récentes, ce qui pourrait avoir un impact sur les résultats. Une étude distincte pourrait être nécessaire pour évaluer la performance d'autres pipelines. De plus, nous n'avons pas été en mesure d'évaluer les performances de la PNL portable pour les phénotypes rares : même si nous avions l'intention d'identifier les patients atteints du syndrome de Brugada à partir des rapports ECG, nous n'avons pas trouvé suffisamment de cas pour une évaluation. Comme indiqué précédemment, les sites n'ont été invités à évaluer qualitativement leurs expériences et à recueillir des données quantitatives au-delà des statistiques de performance qu'au cours du dernier trimestre du projet pilote d'un an ; ainsi, les sites ont dû s'appuyer au moins en partie sur leurs mémoires, ce qui a entraîné la perte de certains détails. Par exemple, malheureusement comme beaucoup de temps s'était écoulé, nous n'avons pas pu estimer avec précision les heures passées ; Cependant, nous avons estimé qu'il était plus important de signaler le temps réel écoulé étant donné la complexité supplémentaire notée d'attendre que les membres de l'équipe sur plusieurs sites soient disponibles. De plus, aucune mesure formelle et normalisée du temps et de l'effort n'a été utilisée, ce qui a conduit à se fier à des estimations qui pourraient également conduire à des rapports incohérents et à des inexactitudes. Enfin, le nombre de cartes examinées pour certains des phénotypes était faible et, pour au moins un phénotype, une seule personne a examiné la carte.
En conclusion, l'intégration de la PNL et du ML dans les algorithmes de phénotypage DSE peut améliorer les performances de phénotypage et permettre un phénotypage en profondeur. De plus, bien que l'application de la PNL sur plusieurs sites implique plusieurs défis, il est possible de développer et de mettre en œuvre des algorithmes de phénotype avec des composants NLP/ML avec des performances reproductibles. Enfin, la PNL nécessite un personnel dédié, compétent en phénotypage DSE et en PNL, et qui communique bien. Compte tenu de la valeur de l'évaluation des méthodes mixtes de la portabilité des algorithmes de phénotype avec NLP/ML, nous recommandons son utilisation dans des études de ce type. Bien que des définitions et des algorithmes de phénotypes portables et reproductibles soient possibles, une planification et une architecture minutieuses des algorithmes qui prennent en charge les personnalisations locales devraient être nécessaires dans un avenir prévisible.
Les données utilisées pour ce travail provenaient de dossiers de santé électroniques qui incluent des données identifiables et ne peuvent donc pas être partagées conformément à la règle de confidentialité HIPAA. Le code est disponible sur PheKB.org sous la page de chaque phénotype et les données d'enquête peuvent être anonymisées et disponibles sur demande en contactant l'auteur correspondant, Jennifer A. Pacheco.
Liao, KP et al. Développement d'algorithmes de phénotype utilisant des dossiers médicaux électroniques et intégrant le traitement du langage naturel. BMJ 350, h1885. https://doi.org/10.1136/bmj.h1885 (2015).
Article Google Scholar
Velupillai, S. et al. Utilisation du traitement clinique du langage naturel pour la recherche sur les résultats de santé : aperçu et suggestions pratiques pour les avancées futures. J. Biomed. Informer. 88, 11–19. https://doi.org/10.1016/j.jbi.2018.10.005 (2018).
Article Google Scholar
Yu, S. et al. Vers un phénotypage à haut débit : extraction et sélection automatisées et impartiales de caractéristiques à partir de sources de connaissances. Confiture. Méd. Informer. Assoc. 22, 993–1000. https://doi.org/10.1093/jamia/ocv034 (2015).
Article Google Scholar
Rajkomar, A., Dean, J. & Kohane, I. Apprentissage automatique en médecine. N. Engl. J. Med. 380, 1347–1358. https://doi.org/10.1056/NEJMra1814259 (2019).
Article Google Scholar
Luo, Y., Uzuner, Ö. & Szolovits, P. Relier la sémantique et la syntaxe avec des algorithmes de graphes - état de l'art de l'extraction de relations biomédicales. Brève Bioinformer. 18, 160–178. https://doi.org/10.1093/bib/bbw001 (2017).
Article Google Scholar
Miller, TA, Avillach, P. & Mandl, KD Expériences de mise en œuvre d'une PNL évolutive, conteneurisée et basée sur le cloud pour extraire à grande échelle les phénotypes des participants à la biobanque. JAMIE Ouvert 3, 185–189. https://doi.org/10.1093/jamiaopen/ooaa016 (2020).
Article Google Scholar
Zeng, Z. et al. Traitement du langage naturel pour le phénotypage informatique basé sur le DSE. IEEE/ACM Trans. Calcul. Biol. Bioinformer. 16, 139–153. https://doi.org/10.1109/TCBB.2018.2849968 (2019).
Annonces d'article Google Scholar
Fils, JH et al. Le phénotypage approfondi sur les dossiers de santé électroniques facilite le diagnostic génétique par les exomes cliniques. Suis. J. Hum. Genet. 103, 58–73. https://doi.org/10.1016/j.ajhg.2018.05.010 (2018).
Article CAS Google Scholar
Friedman C. Vers un système complet de traitement du langage médical : méthodes et enjeux. Proc Conf Am Med Inform Assoc AMIA Fall Symp 595–9 (1997).
Soysal, E. et al. CLAMP—Une boîte à outils pour créer efficacement des pipelines de traitement clinique du langage naturel personnalisés. Confiture. Méd. Informer. Assoc. JAMIE 25, 331–336. https://doi.org/10.1093/jamia/ocx132 (2018).
Article Google Scholar
Savova, GK et al. Mayo Clinical Text Analysis and Knowledge Extraction System (cTAKES) : Architecture, évaluation des composants et applications. Confiture. Méd. Informer. Assoc. JAMIE 17, 507–513. https://doi.org/10.1136/jamia.2009.001560 (2010).
Article Google Scholar
Aronson AR. Cartographie efficace du texte biomédical au Metathesaurus UMLS : Le programme MetaMap. Proc AMIA Symp 17–21 (2001).
Aronson, AR & Lang, F.-M. Un aperçu de MetaMap : perspective historique et avancées récentes. Confiture. Méd. Informer. Assoc. JAMIE 17, 229–236. https://doi.org/10.1136/jamia.2009.002733 (2010).
Article Google Scholar
Banda, JM et al. Avancées du phénotypage électronique : des définitions basées sur des règles aux modèles d'apprentissage automatique. Annu. Rév. Biomed. Data Sci. 1, 53–68. https://doi.org/10.1146/annurev-biodatasci-080917-013315 (2018).
Article Google Scholar
Carrell, DS et al. Défis liés à l'adaptation des systèmes cliniques de traitement du langage naturel existants à des contextes de soins de santé multiples et diversifiés. Confiture. Méd. Informer. Assoc. JAMIE 24, 986–991. https://doi.org/10.1093/jamia/ocx039 (2017).
Article Google Scholar
Sohn, S. et al. Variations de la documentation clinique et portabilité du système PNL : une étude de cas dans les cohortes de naissance asthmatiques dans tous les établissements. Confiture. Méd. Informer. Assoc. JAMIE 25, 353–359. https://doi.org/10.1093/jamia/ocx138 (2018).
Article Google Scholar
Adekkanattu, P. et al. Évaluation de la portabilité d'un système PNL pour le traitement des échocardiogrammes : une étude observationnelle rétrospective multisite. AMIA Annu. Symp. Proc. 2019, 190-199 (2020).
Google Scholar
Hong, N. et al. Développement d'un cadre de phénotypage DSE basé sur le FHIR : une étude de cas pour l'identification des patients obèses et de multiples comorbidités à partir des résumés de sortie. J. Biomed. Informer. 99, 103310. https://doi.org/10.1016/j.jbi.2019.103310 (2019).
Article Google Scholar
Liu, C. et al. Ensembles de systèmes de traitement du langage naturel pour solutions de phénotypage portables. J. Biomed. Informer. 100, 103318. https://doi.org/10.1016/j.jbi.2019.103318 (2019).
Article Google Scholar
Hong, N. et al. Développer un pipeline évolutif de normalisation des données cliniques basé sur le FHIR pour normaliser et intégrer les données non structurées et structurées des dossiers de santé électroniques. JAMIE Ouvert 2, 570–579. https://doi.org/10.1093/jamiaopen/ooz056 (2019).
Article Google Scholar
Sharma, H. et al. Développement d'un système portable de phénotypage basé sur le traitement du langage naturel. BMC Med. Informer. Décis. Mak. 19, 78. https://doi.org/10.1186/s12911-019-0786-z (2019).
Article Google Scholar
Ryan, GW & Bernard, Techniques RH pour identifier les thèmes. Méthodes de terrain 15, 85–109. https://doi.org/10.1177/1525822X02239569 (2003).
Article Google Scholar
Newton, KM et al. Validation des algorithmes de phénotypage à partir du dossier médical électronique : résultats et enseignements tirés du réseau eMERGE. Confiture. Méd. Informer. Assoc. JAMIE 20, e147-154. https://doi.org/10.1136/amiajnl-2012-000896 (2013).
Article Google Scholar
Kho, AN et al. Dossiers médicaux électroniques pour la recherche génétique : Résultats du consortium eMERGE. Sci. Trad. Méd. https://doi.org/10.1126/scitranslmed.3001807 (2011).
Article Google Scholar
Gottesman, O. et al. Le réseau des dossiers médicaux électroniques et de la génomique (eMERGE) : passé, présent et futur. Genet. Méd. Désactivé. Confiture. Coll. Méd. Genet. 15, 761–771. https://doi.org/10.1038/gim.2013.72 (2013).
Article Google Scholar
Ahmed, A. et al. Développement et validation d'un outil de surveillance électronique des lésions rénales aiguës : une analyse rétrospective. J. Crit. Soins 30, 988–993. https://doi.org/10.1016/j.jcrc.2015.05.007 (2015).
Article Google Scholar
Kirby, JC et al. PheKB : un catalogue et un flux de travail pour créer des algorithmes de phénotype électronique pour la transportabilité. Confiture. Méd. Informer. Assoc. JAMIE 23, 1046–1052. https://doi.org/10.1093/jamia/ocv202 (2016).
Article Google Scholar
Shang, N. et al. Rendre le travail visible pour la mise en œuvre du phénotype électronique : leçons tirées du réseau eMERGE. J. Biomed. Informer. 99, 103293. https://doi.org/10.1016/j.jbi.2019.103293 (2019).
Article Google Scholar
Ahmad, FS et al. Mise en œuvre d'un phénotype calculable pour un essai clinique pragmatique national multicentrique : leçons tirées d'ADAPTABLE. Circ. Cardiovasculaire. Qual. Résultats 13, e006292. https://doi.org/10.1161/CIRCOUTCOMES.119.006292 (2020).
Article Google Scholar
Nadkarni, GN et al. Développement et validation d'un algorithme de phénotypage électronique pour les maladies rénales chroniques. AMIA Annu. Symp. Proc. AMIA Symp. 2014, 907–916 (2014).
Google Scholar
Pacheco, JA et al. Une étude de cas évaluant la portabilité d'un algorithme de phénotype calculable exécutable dans plusieurs institutions et environnements de dossiers de santé électroniques. Confiture. Méd. Informer. Assoc. JAMIE 25, 1540–1546. https://doi.org/10.1093/jamia/ocy101 (2018).
Article Google Scholar
Jackson, KL et al. Performance d'un algorithme de phénotype basé sur le dossier de santé électronique pour identifier les cas de Staphylococcus aureus résistant à la méthicilline associés à la communauté et les témoins pour les études d'association génétique. BMC Infect. Dis. 16, 684. https://doi.org/10.1186/s12879-016-2020-2 (2016).
Article CAS Google Scholar
Hsu, J., Pacheco, JA, Stevens, WW, Smith, ME & Avila, PC Précision du phénotypage de la rhinosinusite chronique dans le dossier de santé électronique. Suis. J. Rhinol. Allergie 28(2), 140–144 (2014).
Article Google Scholar
Denny, JC et al. Identification des prédicteurs génomiques de la conduction auriculo-ventriculaire : utilisation des dossiers médicaux électroniques comme outil pour la science du génome. Diffusion 122(20), 2016-2021 (2010).
Article Google Scholar
Walunas, TL et al. Évaluation des données structurées des dossiers de santé électroniques pour identifier les attributs des critères de classification clinique du lupus érythémateux disséminé. Lupus Sci. Méd. 8(1), e000488 (2021).
Article Google Scholar
Chu, SH et al. Un algorithme portable validé de manière indépendante pour l'identification rapide des patients atteints de MPOC à l'aide de dossiers de santé électroniques. Sci. Rep. https://doi.org/10.1038/s41598-021-98719-w (2021).
Article Google Scholar
Safarova, MS, Liu, H. & Kullo, IJ Identification rapide de l'hypercholestérolémie familiale à partir des dossiers de santé électroniques : l'étude SEARCH. J.Clin. Lipidol. 10(5), 1230-1239 (2016).
Article Google Scholar
Gustafson, E., Pacheco, J., Wehbe, F., Silverberg, J. et Thompson, W. Un algorithme d'apprentissage automatique pour identifier la dermatite atopique chez les adultes à partir des dossiers de santé électroniques. En 2017 IEEE International Conference on Healthcare Informatics (ICHI) (eds Gustafson, E. et al.) 83–90 (IEEE, 2017).
Chapitre Google Scholar
Kullo, IJ et al. Tirer parti de l'informatique pour les études génétiques : utilisation du dossier médical électronique pour permettre une étude d'association à l'échelle du génome de la maladie artérielle périphérique. Confiture. Méd. Informer. Assoc. 17, 568-574 (2010).
Article Google Scholar
Savova, GK et al. Découvrir des cas de maladie artérielle périphérique à partir de notes de radiologie en utilisant le traitement du langage naturel. AMIA Annu. Symp. Proc. 2010, 722–726 (2010).
Google Scholar
Sohn, S., Ye, Z., Liu, H., Chute, CG et Kullo, IJ Identification des cas et des témoins d'anévrisme de l'aorte abdominale à l'aide du traitement des rapports de radiologie dans la langue nationale. Sommets AMIA Trad. Sci. Proc. 2013, 249-253 (2013).
Google Scholar
Khaleghi, M., Isseh, IN, Jouni, H., Sohn, S., Bailey, KR, Kullo, IJ Antécédents familiaux en tant que facteur de risque de sténose de l'artère carotide. Accident vasculaire cérébral, 45(8), 2252–6 (2014). Erratum dans : Stroke, 45(9), e198 (2014).
Lingren, T. et al. Algorithme basé sur le dossier de santé électronique pour identifier les patients atteints de troubles du spectre autistique. PLoS One 11(7), e0159621 (2016).
Article Google Scholar
Lingren, T. et al. Développement d'un algorithme pour détecter l'obésité chez les jeunes enfants dans deux centres médicaux pédiatriques tertiaires. Appl. Clin. Informer. 7(3), 693–706 (2016).
Article Google Scholar
Koleck, TA, Dreisbach, C., Bourne, PE et Bakken, S. Traitement du langage naturel des symptômes documentés dans les récits en texte libre des dossiers de santé électroniques : une revue systématique. Confiture. Méd. Informer. Assoc. 26(4), 364–379 (2019).
Article Google Scholar
Chapman, WW et al. Un algorithme simple pour identifier les résultats négatifs et les maladies dans les résumés de sortie. J. Biomed. Informer. 34, 301–310. https://doi.org/10.1006/jbin.2001.1029 (2001).
Article CAS Google Scholar
Harkema, H. et al. ConText : Un algorithme pour déterminer la négation, l'expérimentateur et le statut temporel à partir de rapports cliniques. J. Biomed. Informer. 42, 839–851. https://doi.org/10.1016/j.jbi.2009.05.002 (2009).
Article Google Scholar
Strauss, A. & Corbin, J. Méthodologie de la théorie ancrée : un aperçu. Dans (eds. Denzin, NK & Lincoln, YS) Handbook of Qualitative Research. 273–285 (Thousand Oaks, Californie : SAGE ; 1994).
Google Scholar
Wu, S. et al. La négation n'est pas résolue : généralisabilité versus optimisabilité dans le traitement clinique du langage naturel. PLoS One https://doi.org/10.1371/journal.pone.0112774 (2014).
Article Google Scholar
Wu, P. et al. DDIWAS : Dépistage à haut débit des interactions médicamenteuses basé sur le dossier de santé électronique. Confiture. Méd. Informer. Assoc. 28, 1421–1430. https://doi.org/10.1093/jamia/ocab019 (2021).
Article Google Scholar
Zheng, NS et al. Cadre à haut débit pour les analyses génétiques des effets indésirables des médicaments à l'aide de dossiers de santé électroniques. PLoS Genet. 17, e1009593. https://doi.org/10.1371/journal.pgen.1009593 (2021).
Article CAS Google Scholar
Mehrabi, S. et al. DEEPEN : Un système de détection de négation pour le texte clinique incorporant une relation de dépendance dans NegEx. J. Biomed. Informer. 54, 213–219. https://doi.org/10.1016/j.jbi.2015.02.010 (2015).
Article Google Scholar
Liu, Y., Peng, J., Yu, JJQ et al. PPGAN : Réseau antagoniste génératif préservant la vie privée. En 2019 IEEE 25th Int Conf Parallel Distrib Syst ICPADS 985–9 https://doi.org/10.1109/ICPADS47876.2019.00150 (2019).
Sui, D., Chen, Y., Zhao, J., Jia, Y., Xie, Y., Sun, W. FedED : Apprentissage fédéré par distillation d'ensemble pour l'extraction de relations médicales. In Proc of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP) 2118–2128 (Association for Computational Linguistics, 2020).
Zeng, Z. et al. Récits de DSE formatés en texte enrichi : un trésor caché et ignoré. Étalon. Technol. Santé Informer. 264, 472–476. https://doi.org/10.3233/SHTI190266 (2019).
Article Google Scholar
Terra. https://app.terra.bio/ (Consulté le 23 septembre 2021).
Télécharger les références
Ce travail a été principalement mené dans le cadre de la phase III du réseau eMERGE, et des travaux supplémentaires ont été réalisés dans la phase actuelle du réseau eMERGE ; par conséquent, nous reconnaissons et remercions nos collègues eMERGE dans les deux phases, en particulier ceux qui faisaient/font partie du groupe de travail eMERGE Phenotyping. Nous reconnaissons également le soutien de nos organismes de financement, qui sont énumérés ci-dessous dans la section financement.
Ce travail a été principalement mené dans le cadre de la phase III du réseau eMERGE, qui a été lancé et financé par le NHGRI grâce aux subventions suivantes : U01HG008657 (Group Health Cooperative/University of Washington) ; U01HG008685 (Hôpital Brigham and Women's); U01HG008672 (Centre médical de l'Université Vanderbilt); U01HG008666 (Centre médical de l'hôpital pour enfants de Cincinnati); U01HG006379 (clinique Mayo); U01HG008679 (Clinique Geisinger); U01HG008680 (Sciences de la santé de l'Université Columbia); U01HG008684 (Hôpital pour enfants de Philadelphie) ; U01HG008673 (Université Northwestern); U01HG008701 (Centre médical de l'Université Vanderbilt servant de centre de coordination) ; U01HG008676 (Partenaires Healthcare/Broad Institute) ; U01HG008664 (Baylor College of Medicine); et U54MD007593 (Collège médical Meharry). Des travaux supplémentaires ont été achevés dans la phase actuelle du réseau eMERGE, qui a été lancé et financé par le NHGRI grâce aux subventions suivantes : U01HG011172 (Cincinnati Children's Hospital Medical Center) ; U01HG011175 (Hôpital pour enfants de Philadelphie) ; U01HG008680 (Université Columbia); U01HG008685 (général de masse Brigham); U01HG006379 (clinique Mayo); U01HG011169 (Université Northwestern); U01HG008657 (Université de Washington); U01HG011181 (Centre médical de l'Université Vanderbilt); U01HG011166 (Centre médical de l'Université Vanderbilt servant de centre de coordination). Le développement du phénotype du lupus érythémateux disséminé a également été partiellement financé par l'Institut national de l'arthrite et des maladies musculosquelettiques, subvention 5R21AR072262.
Ces auteurs ont contribué à parts égales : Chunhua Weng et WeiQi Wei.
Université Northwestern, Evanston, États-Unis
Jennifer A. Pacheco, Luke V. Rasmussen, Garrett Eickelberg, Al'ona Furmanchuk, Yu Deng, Yikuan Li, Theresa L. Walunas et Yuan Luo
Institut national de recherche sur le génome humain, Bethesda, États-Unis
Ken Wiley Jr. & Valérie Willis
Université d'État de Pennsylvanie, Hershey, États-Unis
Thomas Nate Personne
Kaiser Permanente Washington Health Research Institute, Seattle, États-Unis
David J. Cronkite et David S. Carrell
Clinique Mayo, Rochester, États-Unis
Sunghwan Sohn, Justin H. Gundelach, Benjamin A. Satterfield, Iftikhar J. Kullo et Ozan Dikilitas
Hôpital général du Massachusetts, Boston, États-Unis
Shawn Murphy
Général de masse Brigham, Somerville, États-Unis
Vivian Gainer et Victor M. Castro
Université Columbia, New York, États-Unis
Cong Liu, Ning Shang, Krzysztof Kiryluk et Chunhua Weng
Hôpital pour enfants de Philadelphie, Philadelphie, États-Unis
Franck Mentch
Centre médical de l'hôpital pour enfants de Cincinnati, Cincinnati, États-Unis
Todd Lingren et Yizhao Ni
Geisinger, Danville, États-Unis
Agnes S. Sundaresan, Roshan Patel et Marc S. Williams
Intermountain Healthcare, Salt Lake City, États-Unis
Néphi Walton
Centre médical universitaire Vanderbilt, Nashville, États-Unis
Joshua C. Smith, Josh F. Peterson, Jodell E. Linder et WeiQi Wei
Icahn School of Medicine à Mount Sinai, New York, États-Unis
Girish N. Nadkarni
Université de Washington, Seattle, États-Unis
Elisabeth A. Rosenthal
Brigham and Women's Hospital, Boston, États-Unis
Elizabeth W. Karlson
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
JAP, LVR, KW, TNP, SS, SNM, VMC, CL, TL, AS, OD, KK, YL, GN, MSW, EWK, JEL, CW, WW ont apporté des contributions substantielles à la conception et/ou à la conception de l'œuvre. Jap, LVR, TNP, DC, SS, SNM, JHG, VSG, VMC, FM, TL, AS, GE, VW, AF, RP, DSC, YD, NW, BS, IJK, OD, JCS, JFP, NS, KK, YN, YL, GN, TLW, MSW, EWK, JEL, CW, WW et / ou l'interprétation des données pour le travail.
Correspondance avec Jennifer A. Pacheco.
Les auteurs ne déclarent aucun intérêt concurrent.
Springer Nature reste neutre en ce qui concerne les revendications juridictionnelles dans les cartes publiées et les affiliations institutionnelles.
Libre accès Cet article est sous licence Creative Commons Attribution 4.0 International, qui autorise l'utilisation, le partage, l'adaptation, la distribution et la reproduction sur tout support ou format, à condition que vous accordiez le crédit approprié à l'auteur ou aux auteurs originaux et à la source, fournissez un lien vers la licence Creative Commons et indiquez si des modifications ont été apportées. Les images ou tout autre matériel de tiers dans cet article sont inclus dans la licence Creative Commons de l'article, sauf indication contraire dans une ligne de crédit au matériel. Si le matériel n'est pas inclus dans la licence Creative Commons de l'article et que votre utilisation prévue n'est pas autorisée par la réglementation légale ou dépasse l'utilisation autorisée, vous devrez obtenir l'autorisation directement du détenteur des droits d'auteur. Pour voir une copie de cette licence, visitez http://creativecommons.org/licenses/by/4.0/.
Réimpressions et autorisations
Pacheco, JA, Rasmussen, LV, Wiley, K. et al. Évaluation de la portabilité des phénotypes calculables avec traitement automatique du langage naturel dans le réseau eMERGE. Sci Rep 13, 1971 (2023). https://doi.org/10.1038/s41598-023-27481-y
Télécharger la citation
Reçu : 15 juin 2022
Accepté : 03 janvier 2023
Publié: 03 février 2023
DOI : https://doi.org/10.1038/s41598-023-27481-y
Toute personne avec qui vous partagez le lien suivant pourra lire ce contenu :
Désolé, aucun lien partageable n'est actuellement disponible pour cet article.
Fourni par l'initiative de partage de contenu Springer Nature SharedIt
En soumettant un commentaire, vous acceptez de respecter nos conditions d'utilisation et nos directives communautaires. Si vous trouvez quelque chose d'abusif ou qui ne respecte pas nos conditions ou directives, veuillez le signaler comme inapproprié.