Cet article fait partie de notre guide: Guide sur la souveraineté du cloud

Les jours du Health Data Hub sur Azure sont-ils comptés ?

Si la CNIL autorise l’hébergement d’un entrepôt de données de santé du Health Data Hub sur Azure pendant trois ans, c’est pour mieux, espère-t-elle, encourager la migration de la plateforme technique vers un cloud souverain. Un projet qui s’annonce difficile au vu des imbroglios réglementaires, techniques et politiques.

Dans une dĂ©libĂ©ration du 21 dĂ©cembre publiĂ©e au journal officiel le 31 janvier 2024, la CNIL autorise le groupement d’intĂ©rĂŞt public « Plateforme de donnĂ©es de santĂ© Â» (GIP PDS) Ă  constituer un entrepĂ´t de donnĂ©es de santĂ© (EDS) Ă©tabli sur les technologies de Microsoft Azure dans le cadre d’un projet europĂ©en initiĂ© par l’agence europĂ©enne des mĂ©dicaments (European Medicines Agency ou EMA).

En 2021, le GIP PDS, plus connu sous le nom de Health Data Hub, a remporté un appel à projets auprès de l’EMA afin de constituer une base de données pour mener des études en pharmacoépidémiologie auprès des patients de cinq établissements de santé français partenaires.

Dans sa délibération, la CNIL précise que ces données sont appariées avec celles du SNDS (Système National des Données de Santé), dans le but d’enrichir les informations sur les patients et sur leurs enfants. Les informations du personnel soignant (spécialité, mode d’exercice, sexe, âge et département d’implantation) sont également requises dans le cadre de ce projet. Les données sont pseudonymisées, chiffrées et sont liées aux bases du SNDS à travers un identifiant technique.

EntrepĂ´t de donnĂ©es EMC2 sur Azure : la CNIL autorise, mais « dĂ©plore Â»

C’est dans ces conditions que la CNIL autorise pour une durĂ©e de trois ans la constitution de l’EDS EMC2 sur la rĂ©gion française du cloud amĂ©ricain Azure. Ă€ contrecĹ“ur, car malgrĂ© les mesures de sĂ©curitĂ© estimĂ©es « proportionnelles aux risques prĂ©sentĂ©s par le traitement Â», cet entrepĂ´t demeure soumis aux lois extraterritoriales amĂ©ricaines.

En sus des fragiles accords d’adéquation de transferts de données à caractère personnel (Data Privacy Framework), l’autorité se méfie sans les nommer du CLOUD Act et du FISA Act.

Pas de transfert de donnĂ©es en dehors de l’UE, prestataire exclusivement soumis au droit europĂ©en, niveau de protection respectant le rĂ©fĂ©rentiel SecNumCloud, voilĂ  les recommandations actuelles de l’AutoritĂ©, des recommandations qu’elle juge en accord avec la doctrine « cloud au centre Â», mĂŞme après son actualisation en mai dernier.

« Pour les entrepĂ´ts de donnĂ©es de santĂ© appariĂ©es avec le SNDS, et malgrĂ© le fait que ces donnĂ©es soient pseudonymisĂ©es, la CNIL a toujours demandĂ© aux porteurs de projet [...] de s’assurer que l’hĂ©bergeur des donnĂ©es n’est pas soumis Ă  une lĂ©gislation extraeuropĂ©enne Â».
CNILDélibération 2023-146 du 21 décembre 2023

« En particulier, pour les entrepĂ´ts de donnĂ©es de santĂ© appariĂ©es avec le SNDS, et malgrĂ© le fait que ces donnĂ©es soient pseudonymisĂ©es, la CNIL a toujours demandĂ© aux porteurs de projet, publics et privĂ©s, de s’assurer que l’hĂ©bergeur des donnĂ©es n’est pas soumis Ă  une lĂ©gislation extraeuropĂ©enne Â», Ă©crit-elle dans sa dĂ©libĂ©ration.

Le choix du Health Data Hub apparaĂ®t alors « en très nette contradiction Â» avec les prĂ©conisations de la CNIL et la politique gouvernementale française.

La polĂ©mique n’est pas nouvelle. Au lancement du groupe en 2019, le Health Data Hub a optĂ© pour Microsoft Azure afin d’hĂ©berger et traiter des donnĂ©es de santĂ©. Ce dĂ©ploiement avait eu lieu Ă  la suite d’une procĂ©dure d’achat simplifiĂ©e par le biais de la centrale UGAP. Depuis lors, ces conditions d’attribution font l’objet de critiques de la part de certains politiques – dont le dĂ©putĂ© MODEM de la 1re circonscription de VendĂ©e, Philippe Latombe â€“, d’associations telles qu’Anticor et des fournisseurs de cloud français.

Les responsables du Health Data Hub, eux, n’ont pas changé de ligne de défense.

« Si beaucoup d’institutions publiques hĂ©bergent leurs donnĂ©es dans des clouds amĂ©ricains, c’est parce que les solutions technologiques amĂ©ricaines offrent des outils aux meilleures normes techniques et de sĂ©curitĂ© Â», Ă©crivaient les membres du conseil scientifique consultatif du Health Data Hub, dans un rapport d’octobre 2023 consacrĂ© aux « bĂ©nĂ©fices et risques de l’utilisation des donnĂ©es de santĂ© Ă  des fins de recherche Â».

Sans nier l’intĂ©rĂŞt d’une solution souveraine, les auteurs jugent que les fournisseurs amĂ©ricains « sont les seuls Ă  pouvoir rĂ©pondre aux exigences des appels d’offres. Il n’existe donc pas d’alternative technologique satisfaisant aux normes de sĂ©curitĂ© de haut niveau, ni en France ni en Europe Â».

Un premier « audit flash Â» encore dĂ©favorable aux acteurs français

Une affirmation que la CNIL souhaitait vĂ©rifier. Ă€ sa demande, dans le cadre du projet EMC2, les pouvoirs publics ont confiĂ© Ă  la dĂ©lĂ©gation du numĂ©rique en santĂ© (DNS), la DINUM et l’Agence du numĂ©rique en SantĂ© une mission d’expertise afin d’évaluer si un hĂ©bergeur europĂ©en pouvait rĂ©pondre aux besoins du Health Data Hub, tout en respectant les exigences de souverainetĂ© et de sĂ©curitĂ©.

La CNIL prĂ©cise d’emblĂ©e que ce travail a Ă©tĂ© effectuĂ© dans un « dĂ©lai très contraint Â». Le rapport a Ă©tĂ© remis le 13 dĂ©cembre 2023. Le 30 dĂ©cembre, Octabe Klaba, prĂ©sident du conseil d’administration d’OVH, rendait publiques sur X les conditions de ce parangonnage.

Selon lui, la liste des exigences a plus que doublĂ© « en deux-trois semaines Â» et le document, un fichier Excel, a connu six versions diffĂ©rentes. Auprès de nos confrères de 01net, les porte-parole de NumSpot et de Cloud Temple assurent avoir vĂ©cu une expĂ©rience similaire.

Pour autant, les fournisseurs consultés ont apprécié la démarche, car c’était la première fois qu’ils avaient accès aux exigences techniques du Health Data Hub pour déployer ces entrepôts de données de santé.

Selon le document remis Ă  la CNIL, « aucun prestataire potentiel ne propose d’offres d’hĂ©bergement rĂ©pondant aux exigences techniques et fonctionnelles du GIP PDS pour la mise en Ĺ“uvre du projet EMC2 dans un dĂ©lai compatible avec les impĂ©ratifs de ce dernier Â».

La CNIL, tout comme les instances des pouvoirs publics et le Health Data Hub s’entendent sur le fait que la migration d’une plateforme cloud Ă  une autre ralentirait la mise en Ĺ“uvre du projet conduit par l’EMA, mais que la mise en place d’un dĂ©monstrateur « cloud de confiance Â» conforme aux Ă  la doctrine cloud au centre « devrait se poursuivre dans les prochaines annĂ©es Â». Des conclusions elles aussi alignĂ©es avec les prĂ©dispositions de la circulaire ministĂ©rielle. Celle-ci prĂ©voit des exceptions quand il n’existe pas d’équivalents chez les fournisseurs et Ă©diteurs de droit europĂ©en.

Un rattrapage technique en cours chez OVHcloud, NumSpot et Cloud Temple

Toutefois, ni la CNIL ni Health Data Hub n’indiquent précisément là où le bât blesse. Voilà quelques éléments connus du MagIT chez les trois acteurs qui se sont exprimés publiquement.

Concernant l’analyse des donnĂ©es, le Health Data Hub utilise des technologies standards : les langages de programmation Python et de R, des serveurs Apache Spark, des notebooks JupyterLab et RStudio, le framework Apache SuperSet pour la visualisation de donnĂ©es, les bases de donnĂ©es MySQL et PostgreSQL, ou encore des dĂ©pĂ´ts git et GitLab. Certains services conteneurisĂ©s sont dĂ©ployĂ©s sur Kubernetes et les ingĂ©nieurs exploitent Ă  la fois des services de stockage en mode objet et en mode fichier. Le tout est poussĂ© selon une logique Infrastructure as code. 

LeMagIT note que les briques de la pile technologique du HDH sont pratiquement toutes agnostiques du fournisseur cloud. Ce sont les notions de « clĂ© en main Â» et d’agilitĂ© qui ont poussĂ© le groupe d’intĂ©rĂŞt public Ă  adopter les solutions Azure.

En la matière, OVH semble le plus avancĂ© et dispose de pratiquement tous les prĂ©requis analytiques. Cloud Temple dĂ©ploie la PaaS Red Hat OpenShift en ce premier trimestre 2024 et prĂ©voit de lancer des services managĂ©s de ce type d’ici 2025. NumSpot prend Ă©galement en charge la plateforme de Red Hat et se prĂ©pare lui aussi au lancement de services DBaaS capables de rĂ©pondre aux besoins du Health Data Hub.

Ajoutons que le GIP PDS propose des environnements de travail isolĂ© les uns des autres, chiffre les donnĂ©es Ă  l’aide d’un HSM « en propre Â» (probablement Azure dedicated HSM), et recourt au IAM Azure Directory et au SIEM Azure Sentinel.

Ces Ă©lĂ©ments-lĂ , les fournisseurs cloud français sont en train de les dĂ©velopper ou de les dĂ©ployer. NumSpot a internalisĂ© le dĂ©veloppement de son IAM et Ă©change très rĂ©gulièrement avec l’ANSSI. OVHCloud termine le dĂ©ploiement d’un gestionnaire unifiĂ© des accès et des rĂ´les. Cloud Temple a dĂ©jĂ  un Bastion et prĂ©voit de fournir des HSM au premier trimestre 2024.

L’enjeu du SecNumCloud pour le SecNumCloud

La vĂ©ritable difficultĂ© tient dans la nĂ©cessaire conformitĂ© de l’ensemble de la pile technologique au rĂ©fĂ©rentiel SecNumCloud. Une exigence nouvelle, selon Octave Klaba.

En temps normal, il est demandĂ© que l’infogĂ©rant ou le fournisseur cloud sĂ©lectionnĂ© soit qualifiĂ© hĂ©bergeur de donnĂ©es de santĂ© (HDS), ce qui est le cas pour OVH, Cloud Temple, NumSpot, IBM, Google Cloud, Microsoft Azure, AWS, Claranet ou encore Coreye. Exemple, selon un document dĂ©claratif, relatif aux outils de tĂ©lĂ©consultation et constituĂ© par le ministère de la SantĂ© en 2020, une bonne partie des 190 Ă©diteurs listĂ©s privilĂ©gie les hĂ©bergeurs HDS français ou europĂ©ens, OVH en tĂŞte.

« La qualification SecNumCloud est nĂ©cessaire pour hĂ©berger [certaines donnĂ©es] du service public. C’est la première fois qu’on nous demandait SecNumCloud pour les donnĂ©es de santĂ© Â», s’étonne Octave Klaba sur X. Un Ă©tonnement partagĂ© par Cloud Temple et NumSpot, selon 01net. De son cĂ´tĂ©, LeMagIT a notĂ© lors de la convention de l’USF que certains organes publics Ă©cartent pour l’heure les fournisseurs français tant que les offres « cloud de confiance Â» de type Bleu ou S3NS ne sont pas pleinement constituĂ©es ou que les solutions IaaS, PaaS et SaaS nĂ©cessaires sont toutes qualifiĂ©es SecNumCloud.

« Il apparaĂ®t plus important de privilĂ©gier la sĂ©curitĂ© informatique, plutĂ´t que la protection contre un hypothĂ©tique risque d’appropriation par les USA de donnĂ©es pseudonymisĂ©es. Â»
Conseil scientifique consultatifHealth Data Hub

Or, la première obtention de la qualification SecNumCloud prend environ deux ans et doit être renouvelée tous les trois ans. Sans parler des frais engagés. Un programme a été mis en place pour accompagner et accélérer ces démarches.

« Il apparaĂ®t plus important de privilĂ©gier la sĂ©curitĂ© informatique, plutĂ´t que la protection contre un hypothĂ©tique risque d’appropriation par les USA de donnĂ©es pseudonymisĂ©es, ce qui ne constituerait pas un dommage pour les citoyens ni individuellement, ni collectivement Â», justifiaient en octobre les membres du conseil scientifique consultatif du Health Data Hub.

Sur LinkedIn, Philippe Latombe, lui, estime qu’en vertu du Data Privacy Framework, la CNIL ne peut pas s’opposer en droit au choix du Health Data Hub, mais que les arguments du conseil scientifique du GIP relèvent d’une « doxa Â», Â« suivie aveuglĂ©ment par la Direction du NumĂ©rique en SantĂ© au ministère. Et cela alors mĂŞme que la sĂ©curitĂ© d’Azure est rĂ©gulièrement mise en cause et que des solutions françaises et europĂ©ennes robustes existent Â».

La CNIL, elle, « regrette que la stratĂ©gie mise en place pour favoriser l’accès des chercheurs aux donnĂ©es de santĂ© n’ait pas fourni l’occasion de stimuler une offre europĂ©enne Ă  mĂŞme de rĂ©pondre Ă  ce besoin Â». La technologie se fait enjeu politique.

Le HDH n’accomplirait pas ses « missions centrales Â» Ă  cause du choix d’Azure

Les auteurs du rapport « FĂ©dĂ©rer les acteurs de l’écosystème pour libĂ©rer l’utilisation secondaire des donnĂ©es de santĂ© Â» menĂ© par JĂ©rĂ´me Marchand-Arvier (ex-conseiller d’État et actuel dĂ©lĂ©guĂ© gĂ©nĂ©ral Ă  l’emploi et Ă  la formation professionnelle auprès du ministère du Travail) apportent un autre niveau de lecture. Le document publiĂ© le 5 dĂ©cembre conclut que le choix de Microsoft Azure a ralenti le Health Data Hub dans l’accomplissement de ses « missions centrales Â».

« [La mission Marchand-Arvier] constate que la migration de la plateforme du HDH sur un cloud souverain a dĂ©jĂ  Ă©tĂ© actĂ©e par le gouvernement. Â»
Mission Marchand-Arvier

« S’il est prĂ©vu depuis 2019 que le Health data hub prenne le relais de la CNAM (Caisse d’Assurance Nationale Maladie) pour la mise Ă  disposition de ces donnĂ©es, cette transition n’a toujours pas Ă©tĂ© opĂ©rĂ©e en raison du blocage du transfert des donnĂ©es de la base principale du SNDS, liĂ© au choix de la solution logicielle Azure de Microsoft pour la plateforme technologique du Health data hub Â», Ă©crivent les rapporteurs.

Selon JĂ©rĂ´me Marchand-Arvier, cette migration qui n’est pas le sujet principal pour les acteurs de la filière est toutefois un « prĂ©alable Â» pour gagner leur confiance. D’ailleurs, la mission partageait la recommandation de la CNIL de mener un « audit flash Â» des acteurs cloud europĂ©ens.

« Il s’agit dĂ©sormais d’acter publiquement et officiellement cette orientation, d’en prĂ©ciser les modalitĂ©s et d’en tirer toutes les consĂ©quences. Â»
Mission Marchand-Arvier

La mission Marchand-Arvier « constate que la migration de la plateforme du HDH sur un cloud souverain a dĂ©jĂ  Ă©tĂ© actĂ©e par le gouvernement. Il s’agit dĂ©sormais d’acter publiquement et officiellement cette orientation, d’en prĂ©ciser les modalitĂ©s et d’en tirer toutes les consĂ©quences Â», poursuivent les auteurs.

Et d’ajouter que « les informations rĂ©unies par la mission permettent d’estimer qu’un horizon de 24 mois est ambitieux, mais crĂ©dible pour l’hĂ©bergement du HDH sur un cloud qualifiĂ© “SecNumCloud” Â». La CNIL justifie l’autorisation de trois ans pour le projet EMC2 puisque cette durĂ©e « correspond Ă  la rĂ©alisation du projet de migration de la plateforme de la PDS, projet confirmĂ© par le gouvernement Â».

Chiche, rĂ©pond en substance SĂ©bastien Lescop, directeur gĂ©nĂ©ral de Cloud Temple dont l’offre PaaS est en cours de qualification SecNumCloud.

« Cette Ă©valuation a permis Ă  Cloud Temple de dĂ©montrer un degrĂ© de conformitĂ© Ă©levĂ©, qui atteindra 95 % au printemps 2024, après la qualification SecNumCloud des nouveaux services PaaS de confiance de notre plateforme Â», dĂ©clare-t-il dans un communiquĂ© de presse. « Nous sommes confiants dans le respect des engagements pris par les pouvoirs publics concernant la migration du Health Data Hub vers un hĂ©bergement qualifiĂ© SecNumCloud, via l’organisation d’un appel d’offres en 2025 Â».

Pour approfondir sur PaaS