Réaliser une recherche sur données

Réaliser une recherche sur données
L’Entrepôt de Données de Santé de l’AP-HP, le plus gros entrepôt de données de santé hospitalier en Europe, contient aujourd’hui les données de plus de 11 millions de patients. Il appuie plus de 60 projets de recherche et d’innovation.

Les recherches en cours

Les recherches en cours ont reçu un avis favorable du Comité Scientifique et Éthique de l’Entrepôt de Données de Santé.

Consulter la liste des recherches en cours   

Un processus d'accès simplifié aux données

Consultez les règles d'accès aux données de santé de AP-HP, validées par la Commission Médicale d'Etablissement (CME), en cliquant sur le lien ci-dessous.

Accéder aux règles d'accès aux données de santé de AP-HP  

En pratique, cliquez sur le lien ci-dessous pour accéder aux données de l'EDS.

Accéder aux données de l'EDS  

 

Vous êtes professionnel de santé à l'AP-HP

Sur simple demande au coordonnateur EDS du GH, et information de votre chef de service, vous pouvez accéder rapidement aux données des patients pris en charge dans votre service. Une formation aux outils et aux règles d'usage de l'EDS vous sera dispensée avant la réalisation de votre projet « équipe de soins » auquel ne peuvent s'associer que des personnels AP-HP membres de l'équipe de soin.

 

POUR UNE RECHERCHE À PLUS LARGE ÉCHELLE

En tant que professionnel de santé de l’AP-HP porteur d’un projet à l'échelle (dit « multicentrique », hors périmètre « équipe de soins »), avec ou sans partenaire externe, vous devez soumettre votre projet de recherche à l’avis du Comité Scientifique et Ethique de l’AP-HP (CSE) en remplissant ce formulaire. Celui-ci contient toutes informations que vous devez renseigner dans le cadre d’un dépôt de projet.

 

 

L’autorisation donnée par la CNIL pour la constitution de l’EDS permet un accès simplifié aux données dans le respect des droits des patients. Ceux-ci conservent à tout moment la possibilité de s’opposer à la réutilisation de leurs données grâce à un dispositif d’opposition en ligne.

L’accès à l’EDS est conditionné au seul avis du CSE - lequel se réunit une fois par mois - si la recherche réalisée est conforme à la méthodologie de référence MR004. Sans compter le délai de contractualisation en cas de partenariat, si les données sont disponibles au sein de l'EDS, vous y accédez dans un délai de l'ordre de 3 mois.

 

Un accompagnement personnalisé

Les référents EDS, présents au sein de chaque groupe hospitalo-universitaire, les chefs de projets et les data scientists, qui travaillent dans les Unités de Recherche Clinique (URC) vous accompagnent dans la constitution de la demande d'avis CSE, l'exploration des données et l'utilisation des outils de traitement.

Les chefs de projets des URC réalisent l'analyse de conformité MR004 de la recherche. Les data scientists en évaluent la faisabilité avant leur soumission à l’avis du CSE, exécutent les requêtes de création des vues multicentriques avec les données mises à disposition après avis favorable du CSE et participent aux traitements de données, à la rédaction des rapports d'analyse et aux publications.

 

Liste des coordinateurs GH et Datascientists    

 

Un accompagnement par des data scientists experts en traitement automatique du langage est également disponible auprès de la DSN.

Image
Recherche multicentrique
Agrandir l'infographie

Les outils

Par ailleurs, l'équipe en charge de l'EDS à la Direction des Services Numeriques met à disposition les données nécessaires à la recherche au sein d'un espace de travail privé et dédié à la recherche sur la plateforme i2b2/Cohort360/Jupyter.

 
i2b2

est une solution open source permettant de sélectionner des cohortes de patients et de construire des environnements de travail sécurisés avec les données nécessaires, mises à disposition pour chaque projet de recherche.

i2b2   

 
Cohort 360

est un outil de visualisation de cohortes de patients. Il permet de visualiser les données de cohortes sélectionnées automatiquement mais aussi affinées manuellement, avec la possibilité de visualiser des graphiques. Il permet également de réaliser des recherches puissantes directement dans les textes médicaux.

Cohort360   

 
jupyter

Jupyter est une application web dédiée à l’analyse de données massives permettant de programmer dans plusieurs langages (Python, R, Scala...).

Jupyter   

 

Jupyter donne aussi accès à un ensemble de bibliothèques :

« Bibliothèques de data science » : Plusieurs bibliothèques dédiées à l’analyse des données de santé de l’EDS ont été développées. EDS-NLP et EDS-Scikit facilitent par exemple l’analyse des documents cliniques et des données structurées. Ces outils sont développés en open source en associant étroitement divers partenaires.

GitHub   

« Catalogue de modèles » : Plusieurs modèles de machine learning sont disponibles pour faciliter l’analyse des données de l’EDS, en particulier les données textuelles (modèle de langage EDS-CamemBERT, extraction de certaines comorbidités, etc.).

 
REDCap

est une solution de mise en place de formulaires structurés pour la saisie manuelle d’information, complémentaires de l’EDS, dans le cadre de recherches internes n’impliquant pas la personne humaine (RNIPH).

REDCap   

 

 

Image
Articulation outils
Agrandir l'infographie

Les utilisations

Au-delà des recherches conduites au sein des équipes de soins, parmi les 30 projets de plus grande envergure en cours de réalisation, on compte :

  • des études épidémiologiques observationnelles,
  • des développements d’algorithmes d'aide à la décision diagnostiques ou pronostiques (dont des algorithmes d’apprentissage automatique à partir de données d’imagerie, de données biologiques ou de comptes rendus médicaux),
  • des évaluations d’algorithmes en conditions réelles.

Toutes ces études sont menées soit par des professionnels de l’AP-HP soit en collaboration avec des partenaires extérieurs.

 

Cinq projets sont notamment en voie de finalisation et de publication :

 

Le Professeur Olivier Steichen a étudié les profils de recours aux soins hospitaliers, en particulier aux urgences, des patients drépanocytaires, ainsi que l’influence des comorbidités psychiatriques sur les durées d’hospitalisation.

 

La Professeure Muriel Fartoukh a cherché à identifier les facteurs pronostiques précoces d’évolution défavorable chez les patients hospitalisés pour grippe en réanimation, unités de soins continus et unité de soins intensifs.

 

Le Docteur Ivan Lerner développe des modèles de prédiction des évènements hypotensifs chez les patients hospitalisés en réanimation.

 

La Professeure Isabelle Thomassin-Naggara évalue, sur des mammographies et tomosynthèses acquises en conditions réelles, un algorithme de caractérisation automatique de lésions mammaires développé par la société Incepto pour mettre au point un modèle de risque basé sur la densité mammaire.

 

Le Docteur Antoine Neuraz mène un projet en collaboration avec Sorbonne Université pour extraire automatiquement les données de prescriptions médicamenteuses à partir des comptes rendus médicaux.

Les consignes de publication

Pour toute recherche hors COVID-19, les publications relatives à des études réalisées à partir des données de l’EDS de l’AP-HP y font référence sous la forme de « l’Entrepôt de Données de Santé de l’Assistance Publique – Hôpitaux de Paris (AP-HP) » ou « AP-HP Clinical Data Warehouse » ou « Clinical Data Warehouse of Greater Paris University Hospitals ».

 

Pour toute recherche COVID-19, les consignes spécifiques de publication sont disponibles au lien ci-dessous :

 

Consignes spécifiques de publication liée à la COVID-19   

 

Consulter les publications