La plateforme technologique du Hub est opérationnelle depuis le printemps, mais elle comprend uniquement des données relatives à l'épidémie de Covid-19 et repose sur des décrets et arrêtés pris dans le cadre de l'état d'urgence sanitaire.
Un autre décret, dont la publication attendue est depuis l'automne, doit pérenniser son fonctionnement et lui permettre d'intégrer à la fois la "base principale", issue du système national des données de santé (SNDS) dit "historique", et le "catalogue" (ou SNDS dit "élargi"), qui est une collection de bases de données, afin de les mettre à disposition.
Le SNDS historique est composé des données du système national d'information inter-régimes de l'assurance maladie (Sniiram), du programme de médicalisation des systèmes d'information (PMSI), des données du Centre d'épidémiologie sur les causes médicales de décès (CépiDC), auxquelles sont venues s'ajouter celles du système d'information (SI) des maisons départementales des personnes handicapées (MDPH).
Stéphanie Combes a dévoilé le 18 février la liste des bases de données, dans un document également communiqué à TICpharma.
"Le catalogue rassemblera des copies de bases déjà existantes pour la plupart, jugées les plus pertinentes pour la recherche et l’innovation. Un comité stratégique piloté par l’Etat fixera les grandes orientations de ce catalogue qui se veut évolutif. Cette collection est construite de manière progressive et itérative, en partenariat avec les responsables de la collecte des données", est-il rappelé dans le document.
Aujourd'hui, seules deux bases de données sont disponibles via le Hub: la base Oscour de Santé publique France (SPF), qui comprend des résumés des passages individuels aux urgences, et la base "SNDS Fast Track", qui permet une remontée rapide des informations du PMSI sur les séjours Covid-19 dans les établissements de santé.
En tout, 43 bases sont pressenties pour ĂŞtre mises au catalogue.
Elles proviennent du ministère de la santé (DGS, Drees), de la Caisse nationale de l'assurance maladie (Cnam), d'établissements de santé publics ou privés, de centres de lutte contre le cancer (CLCC), d'institutions de recherche, mais aussi de sociétés privées dont le groupe mutualiste Malakoff Humanis, la start-up Implicity ou encore Roche.
L'état d'avancement de leur intégration est noté de 1 à 4, le 1 étant seulement des "premiers échanges", et le 4 une mise au catalogue en 2021.
Dix bases de données devraient rejoindre le catalogue cette année. Parmi celles-ci, deux contiennent des données relatives à l'épidémie: Sivic, qui contient les prises en charge hospitalières des patients Covid-19 au niveau national, et Sidep, qui rassemble les résultats des tests Covid-19.
L'intégration de Vaccins Covid, qui rassemble les données de suivi de la vaccination contre le Covid-19, est évaluée à 2 sur 4.
Quatre autres bases de données liées au Covid-19 en sont à l'étape 1 ou 2 vers l'intégration au catalogue:
- la base Samu du CHU d'Amiens, qui contient les données d'appels liés au Covid-19 des Samu de Bordeaux, Nantes, Pontoise, Versailles, Melun et Amiens
- la base STOIC de l'Assistance publique-hôpitaux de Paris (AP-HP): scanners thoraciques de patients suspectés de Covid-19 et données de suivi
- la base parcours de l'Ecole des hautes études en santé publique (EHESP): données médicales de prise en charge de patients atteints de Covid-19 et transférés entre hôpitaux
- la base EPICOV de l'Inserm et la Drees, issue d'une enquête sur le Covid-19 menée auprès de 135.000 personnes tirées au sort par l'Insee et qui ont répondu à un questionnaire.
Hors Covid-19, six bases de données devraient intégrer le catalogue en 2021:
- la cohorte I-Share de l'université de Bordeaux: suivi de la santé et des habitudes de consommation de 21.000 étudiants
- la base ESME issue de l'entrepôt de données de santé (EDS) d'Unicancer, qui rassemble des données sur des patientes atteintes d’un cancer du sein métastatique traitées dans les 18 CLCC
- la base BNDMR de l'AP-HP, qui contient les dossiers de plus de 500.000 patients atteints de 4.700 maladies rares
- la base Epithor du conseil national professionnel de chirurgie thoracique et cardio-vasculaire (CNP CTCV), sur des interventions de chirurgie thoracique
- les données d'aide à l'orientation et à l'optimisation de l'offre de soins et médico-sociale de Viatrajectoire, outil géré par le groupement de coopération sanitaire (GCS) Sara
- les données de dépistage de cancer du sein des départements du Gard et de la Lozère de la base e-SIS du centre régional de coordination de dépistage des cancers (CRCDC) Occitanie.
La composition précise du catalogue n'est pas encore officiellement arrêtée.
Celui-ci est attendu "en février ou mars" 2021, a par ailleurs indiqué Stéphanie Combes lors de son audition.
Le conseil de la Caisse nationale de l’assurance maladie (Cnam) s'est de nouveau opposé à l'hébergement du Health Data Hub par Microsoft Azure le 19 février, note-t-on.
Un avis de la Commission nationale de l'informatique et des libertés (Cnil) sur la liste des bases inscrites au catalogue est attendu en mai ou juin.
Il sera suivi d'un arrêté du ministre des solidarités et de la santé fixant cette liste, espéré en juin ou juillet.
La directrice du Health Data Hub a également évoqué les priorités du Hub pour 2021, notamment "continuer la mise en place de la structure, qui n'a qu'un an".
Le Hub compte actuellement "une cinquantaine de collaborateurs" et ambitionne de passer à 70 cette année.
Les autres priorités sont "industrialiser l'accompagnement des projets de bout en bout, mettre en place des partenariats stratégiques ou les développer, notamment avec la Caisse nationale de l'assurance maladie [Cnam], l'Inserm et des établissements de santé, et toute la partie infrastructure technologique".
Il faut également "associer le grand public, pour qu'il comprenne ce qu'est le Health Data Hub, c'est important étant donné la sensibilité des données".
Interrogée par les députés, Stéphanie Combes a longuement justifié le choix de confier l'hébergement de la plateforme à Microsoft Azure au détriment de solutions françaises ou européennes du fait d'un niveau de sécurité et des services toujours inférieur.
Elle a rappelé qu'il n'y a pas eu de marché public, le choix d'Azure s'étant fait par l'intermédiaire de l'Ugap.
"Si on avait fait un marché public, Microsoft l'aurait remporté", a-t-elle assuré.
Interrogée sur la possibilité d'une réversibilité de la plateforme, elle a indiqué que "pour que la réversibilité soit faisable, il faut que la cible soit prête", c'est-à -dire que le nouvel hébergeur réponde aux demandes du Hub. Or, "ce n'est pas le cas" aujourd'hui.
Toutefois, le Hub planche sur une comparaison des solutions d'hébergement souveraines et collabore avec la direction interministérielle du numérique (Dinum) pour actualiser son étude de réversibilité au premier semestre 2021.
Il échange "régulièrement" avec d'autres acteurs de l'hébergement, dont les français OVH et Outscale (filiale de Dassault Systèmes).
Également auditionné par la mission d’information jeudi midi, Marc Cuggia, professeur d’informatique médicale, praticien hospitalier au CHU de Rennes et coordonnateur scientifique du réseau Ouest Datahub regroupant les centres de données cliniques des établissements du groupement de coopération sanitaire (GCS) Hôpitaux universitaires du Grand Ouest (Hugo), est revenu sur ce choix.
Pour rappel, Marc Cuggia est coauteur du rapport de préfiguration du Health Data Hub en 2018, avec Dominique Polton, ex-présidente de l’Institut national de données de santé (INDS), et Gilles Wainrib, président-fondateur de la start-up Owkin.
"Je n'ai pas compris pourquoi on souhaite mettre en place une solution souveraine mais utiliser des technologies qui ne sont pas portées par des acteurs français ou au moins européens", a-t-il déploré, soulignant une décision "paradoxale".
"Il y a des solutions et à l'époque nous avions plusieurs pistes. Par exemple, il y a une structure très intéressante qui s'appelle TeraLab et qui a été développée pour faire du big data et accompagner des projets. Elle aurait été une bonne solution, au moins transitoirement, pour tester et organiser les choses sur le plan du déploiement du Health Data Hub", a-t-il complété.
Si Marc Cuggia a estimé que "technologiquement", le choix de Microsoft Azure était "sans doute justifié", il s'est interrogé: "pourquoi d'autres solutions et qui n'auraient pas fait débat, n'ont-elles pas été examinées ?".
"Il y avait des solutions viables sous cloud aussi, qui auraient tout à fait pu être investiguées, au moins en phase de montée en charge."
"Si on a une stratégie de souveraineté et qu'on n'a pas besoin de toutes ces structures, il faut que cela s'applique à tous les champs, pas seulement à celui du Health Data Hub", a toutefois insisté le Pr Cuggia, rappelant que Microsoft détient la certification "hébergeur données de santé" (HDS) et traite déjà des données de santé nominatives.
Par ailleurs, le Health Data Hub et le GCS Hugo ont annoncé le 19 février avoir noué une collaboration pour "identifier les incompatibilités de médicaments ainsi que les critères conduisant à des ruptures de traitement" et pour réduire les accidents iatrogéniques.
Enfin, la mission d'information a également auditionné l'association Interhop, qui milite pour l'utilisation des logiciels libres en santé et est à l'origine des recours contre l'hébergement du Hub par Microsoft.
L'association s'inquiète du droit américain et de ses principes d'extra-territorialité, ainsi que de la centralisation des données au sein d'un seul acteur, mais "ne s'oppose pas à la recherche sur les données de santé", a expliqué son président, le Dr Adrien Parrot.
"L'erreur originelle du Health Data Hub est d'avoir confondu la technique et la gouvernance. La gouvernance peut être centralisée. Sur le plan technique, nous proposons de centraliser le développement de code, mais de décentraliser les données" au sein d'une multitude d'acteurs, tels que les entrepôts de données de santé (EDS) hospitaliers.
Pas de cyberattaques contre le Hub Interrogée par les députés, Stéphanie Combes a indiqué que le HDH "n'a pas fait l'objet de cyberattaques" à ce jour. La Dinum mène actuellement un audit de sécurité du Hub. |
Vos réactions