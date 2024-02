Dans une délibération du 21 décembre publié au journal officiel le 31 janvier 2024, la CNIL autorise le groupement d’intérêt public « Plateforme de données de santé » (GIP PDS) à constituer un entrepôt de données de santé (EDS) établie sur les technologies de Microsoft Azure dans le cadre d’un projet européen initié par l’agence européenne des médicaments (European Medicines Agency ou EMA).

En 2021, le GIP PDS, plus connu sous le nom de Health Data Hub, a remporté un appel à projets auprès de l’EMA afin de constituer une base de données en vue de mener des études en pharmacoépidémiologie auprès des patients de cinq établissements de santé français partenaires.

Dans sa délibération, la CNIL précise que ces données sont appariées avec celles du SNDS (Système National des Données de Santé), dans le but d’enrichir les informations sur les patients et sur leurs enfants. Les informations du personnel soignant (spécialité, mode d’exercice, sexe, âge et département d’implantation) sont également requises dans le cadre de ce projet. Les données sont pseudonymisées, chiffrées et sont liées aux bases du SNDS à travers un identifiant technique.

« Si beaucoup d’institutions publiques hébergent leurs données dans des clouds américains, c’est parce que les solutions technologiques américaines offrent des outils aux meilleures normes techniques et de sécurité », écrivaient les membres du conseil scientifique consultatif du Health Data Hub, dans un rapport d’octobre 2023 consacré aux « bénéfices et risques de l’utilisation des données de santé à des fins de recherche ».

La polémique n’est pas nouvelle. Au lancement du groupe en 2019, le Health Data Hub a opté pour Microsoft Azure pour héberger et traiter des données de santé. Ce déploiement avait eu lieu à la suite d’une procédure d’achat simplifiée par le biais de la centrale UGAP. Depuis lors, ces conditions d’attribution font l’objet de critiques de la part de certains politiques, dont le député MODEM de la 1 re circonscription de Vendée, Philippe Latombe, des associations telles qu’Anticor et des fournisseurs de cloud français.

« En particulier, pour les entrepôts de données de santé appariées avec le SNDS, et malgré le fait que ces données soient pseudonymisées, la CNIL a toujours demandé aux porteurs de projet, publics et privés, de s’assurer que l’hébergeur des données n’est pas soumis à une législation extraeuropéenne », écrit dans sa délibération.

La CNIL, tout comme les instances des pouvoirs publics et le Health Data Hub s’entendent sur le fait que la migration d’une plateforme cloud à une autre ralentirait la mise en œuvre du projet conduit par l’EMA, mais que la mise en place d’un démonstrateur « cloud de confiance » conforme aux à la doctrine cloud au centre « devrait se poursuivre dans les prochaines années ». Des conclusions elles aussi alignées avec les prédispositions de la circulaire ministérielle. Celle-ci prévoit des exceptions quand il n’existe pas d’équivalents chez les fournisseurs et éditeurs de droit européen.

Selon lui, la liste des exigences a plus que doublé « en deux-trois semaines » et le document, un fichier Excel, a connu six versions différentes. Auprès de nos confrères de 01net, les porte-parole de NumSpot et de Cloud Temple assurent avoir vécu une expérience similaire.

Une affirmation que la CNIL souhaitait vérifier. À sa demande, dans le cadre du projet EMC2, les pouvoirs publics ont confié à la délégation du numérique en santé (DNS), la DINUM et l’Agence du numérique en Santé une mission d’expertise afin d’évaluer si un hébergeur européen pouvait répondre aux besoins du Health Data Hub tout en respectant les exigences de souveraineté et de sécurité.

Un rattrapage technique en cours chez OVHcloud, NumSpot et Cloud Temple

Toutefois, ni la CNIL ni Health Data Hub indique précisément là où le bât blesse. Voilà quelques éléments connus du MagIT chez les trois acteurs qui se sont exprimés publiquement.

Concernant l’analyse des données, le Health Data Hub utilise des technologies standards : les langages de programmation Python et de R, des serveurs Apache Spark, des notebooks JupyterLab et RStudio, le framework Apache SuperSet pour la visualisation de données, les bases de données MySQL et PostgreSQL, ou encore dépôts git et GitLab. Certains services conteneurisés sont déployés sur Kubernetes et les ingénieurs exploitent à la fois des services de stockage en mode objet et en mode fichier. Le tout est poussé selon une logique Infrastructure as code.

LeMagIT note que les briques de la pile technologique du HDH sont pratiquement toutes agnostiques du fournisseur cloud. Ce sont les notions de « clé en main » et d’agilité qui ont poussé le groupe d’intérêt public à adopter les solutions Azure.

En la matière, OVH semble le plus avancé et dispose de pratiquement tous les prérequis analytiques. Cloud Temple déploie la PaaS Red Hat OpenShift en ce premier trimestre 2024 et prévoit de lancer des services managés de ce type d’ici 2025. NumSpot prend également en charge la plateforme de Red Hat et se prépare lui aussi au lancement de services DBaaS capables de répondre aux besoins du Health Data Hub.

Ajoutons que le GIP PDS propose des environnements de travail isolé des uns des autres, chiffre les données à l’aide d’un HSM « en propre » (probablement Azure dedicated HSM), recourt au IAM Azure Directory et au SIEM Azure Sentinel.

Ces éléments-là, les fournisseurs cloud français sont en train de les développer ou de les déployer. NumSpot a internalisé le développement de son IAM et échange très régulièrement avec l’ANSSI. OVHCloud termine le déploiement d’un gestionnaire unifié des accès et des rôles. Cloud Temple a déjà un Bastion et prévoit de fournir des HSM au premier trimestre 2024.