mast3r - stock.adobe.com

StaneResearch combine recherche médicale en ville, cloud souverain et IA

Avec StaneResearch, la startup française Stane entend participer au retour de la recherche médicale en ville. Traitements de données, IA et cloud souverain sont au cœur du dispositif.

Fondée par des médecins en 2020, la société Stane a lancé son activité en accompagnant la création de maisons de santé pluriprofessionnelles de ville. Elle a participé à la naissance d’une centaine de structures en France.

Aujourd’hui, Stane revendique un réseau composé de 2 100 professionnels de santé, plus de 150 maisons de santé et plus de 50 partenaires. Après avoir obtenu son statut de société à mission en 2021, la startup a lancé l’année suivante StaneLab. En tant que société de recherche contractuelle, elle fournit des services de recherche médicale aux grands groupes de l’industrie pharmaceutique, aux organismes de recherches publics ou encore aux startups.

Stane se veut l’intermédiaire entre des organisations de recherche médicale et des professionnels de santé dont les patients sont éligibles à des études cliniques. Outre le fait de proposer des solutions en avance de phase, les médecins de ville peuvent se former sur diverses pathologies et obtiennent une rémunération complémentaire.

En 2023, c’est avec ce projet que la startup a levé 10 millions d’euros avec le soutien du fonds Mutuelles Impact et du fonds souverain de la région Auvergne-Rhône-Alpes. « Nous avons travaillé pendant deux ans pour apporter des solutions technologiques afin de favoriser le retour de la recherche en ville », lance Tiphanie Perre, directrice générale et cofondatrice de Stane. Ces solutions sont rassemblées dans la plateforme StaneResearch.  

Biais, données agrégées de piètre qualité : pourquoi Stane prône le retour de la recherche clinique en ville

Pourquoi favoriser la recherche clinique en ville ? « Pratiquement 100 % de la recherche clinique est hospitalière, alors que les hôpitaux ne représentent que 20 % des soins », constate Thomas Cantaloup, médecin-psychiatre et directeur médical chez Stane.

Julia Marchal, directrice SMM France, biopharmaceuticals clinical operations chez AstraZeneca, explique ce phénomène au sein de son groupe. « Aujourd’hui, nous sommes confrontés à la complexité des protocoles », affirme-t-elle. « Ce sont des protocoles internationaux, multicentriques, qui doivent répondre à des standards en matière de qualité, de conformité, et générer un certain nombre de données comparables d’un pays à l’autre, d’une structure à l’autre », poursuit-elle. « De ce fait, nous nous sommes beaucoup tournés vers l’hospitalier parce que les structures hospitalières nous permettent d’obtenir une forme de structuration ».

Or, les données hospitalières contiennent des biais de représentativité, selon le directeur médical de Stane. Certaines pathologies et leurs stades avancés sont surreprésentés.

« En biopharmaceutique, nous travaillons majoritairement sur des maladies chroniques. Les patients vont généralement voir leur médecin traitant dans des cabinets de ville, et nous ne les retrouvons pas nécessairement en milieu hospitalier », témoigne Julia Marchal. « Les patients atteints de maladies chroniques sont également à l’hôpital, mais à des niveaux graves ou très exacerbés ».

Par le passé, AstraZeneca a pu mener en France des projets de recherche auprès de médecins de ville. Mais la complexité administrative et contractuelle l’a petit à petit amenée à concentrer ses efforts sur les hôpitaux.

Les industriels peuvent également faire appel au service d’agrégateurs. « Les agrégateurs, ce sont l’ensemble des personnes, prestataires, sociétés, entreprises, qui vont agréger en masse des données de santé qui proviennent de différentes sources et les mettre à disposition », explique Mehdi Djelamani, cofondateur et président de Stane.

« Le problème, c’est que cette agrégation, très souvent, est faite de façon très grossière, peu précise, les données sont peu structurées et leur origine n’est pas certaine », ajoute-t-il. « J’appelle ça des pochettes surprises. Finalement, quand l’on ouvre les fichiers, l’on se rend compte que les données sont la plupart du temps inexploitables pour la recherche clinique ».

Le fait que les 150 structures accompagnées par Stane sont réparties sur l’ensemble du territoire permettrait aux industriels d’obtenir des données plus diversifiées et plus proches de la vérité terrain. La startup dit également favoriser la réduction du délai nécessaire – de huit à moins de deux mois – pour inclure des patients dans les études cliniques.

« Nous le faisons depuis près de deux ans de manière artisanale », explique Thomas Cantaloup. « Il fallait automatiser, synchroniser et fluidifier le travail pour les industriels et les professionnels de santé ».

StaneResearch, une plateforme pour simplifier les études cliniques

D’où la naissance de StaneResearch. L’outil combine le réseau de professionnels, des interfaces en direction des industriels et des médecins, ainsi qu’un entrepôt de données de santé.

La fonctionnalité d’onboarding permet aux professionnels de santé de s’enregistrer rapidement sur la plateforme à l’aide de leur carte professionnelle. À cela s’ajoute une e-formation de deux heures.

StaneResearch couvre deux types d’études. Il y a d’abord les études interventionnelles réalisées avant la mise sur le marché d’un traitement ou d’un dispositif médical auprès de patients. Ces études peuvent être menées dans des hôpitaux ou, dans certains cas, les médecins peuvent suivre leur patient depuis leur cabinet.

Ensuite, les études observationnelles impliquent de collecter des données auprès de cohortes de patients. Elles sont rétrospectives, par exemple, pour le suivi épidémiologique post-commercialisation d’un traitement, ou prospectives, dans le cadre de la recherche de nouvelles molécules.

StaneResearch s’intègre avec les systèmes d’information des cabinets. Cela demande des partenariats avec les éditeurs et de développer des connecteurs ad hoc. La plateforme recueille les données des patients et exécute des algorithmes afin d’identifier les patients éligibles aux études publiés sur la plateforme par les promoteurs industriels.

« Nous sommes parmi les premiers sur le marché à proposer une solution fonctionnelle permettant d’intégrer des SI et des grands entrepôts de données à des fins de recherche ».
Dr. Mehdi DjelamaniCofondateur et président, Stane

« Nous sommes parmi les premiers sur le marché à proposer une solution fonctionnelle permettant d’intégrer des SI et des grands entrepôts de données à des fins de recherche », affirme Mehdi Djelamani. « Nous avons essuyé beaucoup de plâtres et nous allons encore en essuyer beaucoup, mais nous sommes fiers de pouvoir le proposer ».

En premier lieu, l’outil de Stane doit aider les médecins « investigateurs » à identifier les patients éligibles aux études à travers un système de présélection. Une approche qui intéresse AstraZeneca en France.

Cette présélection peut être réalisée dès qu’un industriel partage son projet d’étude, ce qui permettrait d’identifier les bons patients et de réduire les coûts.

Stane dit également automatiser une partie des tâches administratives nécessaires à la mise en place des études. Sa plateforme sert aussi à suivre les patients tout au long du processus en collectant ses données de manière sécurisée.

« Aujourd’hui, si un médecin participe à une étude, généralement, il faut qu’il retienne une vingtaine d’informations différentes, qu’on appelle les critères d’inclusion ou d’exclusion », explique Mehdi Djelamani. « Il doit savoir qu’on parle d’une femme, d’un homme de plus de 50 ans, avec telle ou telle pathologie, et les critères sont de plus en plus compliqués ».

Ce foisonnement d’informations à retenir en même temps que d’effectuer les consultations et de s’occuper des tâches administratives seraient l’une des raisons pour lesquelles les médecins de ville ont cessé de participer à la mise en place d’études biomédicales, selon Stane.

Des processus NLP avancés

Problème, même les critères, entre 5 et 20 par étude en moyenne, sont plus ou moins complexes. « Ces critères peuvent être relativement simples, comme l’âge, le poids, une pathologie donnée », relate Antoine Neuraz, médecin de santé publique et chief data officer chez Stane. « Ils peuvent aussi toucher des données qui sont plus complexes, comme des résultats de biologie, des prescriptions médicales, voire des observations effectuées lors d’examens. Par exemple, un promoteur peut avoir besoin de connaître l’épaisseur du ventricule gauche mesurée lors d’une échographie ».

Des informations souvent « enterrées au plus profond du dossier médical ». « C’est pourquoi nous avons fait le choix de passer par un entrepôt de données de santé », explique Antoine Neuraz.

De fait, Stane doit faire avec l’hétérogénéité des formats de données pris en charge par les SI des professionnels de santé. « Nous connectons les logiciels métiers et nous essayons de standardiser les données pour les faire parler en un langage unique ».

Avant cela, il faut contacter les patients afin de leur demander si Stane et ses partenaires peuvent exploiter les données de santé. Ensuite, la startup met en place un processus de pseudonymisation.

Autre défi, environ 80 % des données collectées sont non structurées. « Nous avons mis en place des méthodes d’IA et de NLP pour extraire l’information de textes et la structurer afin de la rendre exploitable », relate le CDO.

« Toute la difficulté réside dans la liaison entre l’énoncé du critère et la manière dont il est évoqué dans le dossier patient ».
Dr. Antoine NeurazCDO, Stane

Ces algorithmes sont capables d’identifier les critères complexes et les faire correspondre avec le dossier d’un patient. « Toute la difficulté réside dans la liaison entre l’énoncé du critère et la manière dont il est évoqué dans le dossier patient », indique Antoine Neuraz. « Parfois, les critères d’exclusion sont plus difficiles à trouver : le fait qu’un patient n’est pas atteint de pathologie cardiovasculaire ne figure pas dans le dossier médical. Il faut pouvoir faire le lien entre ces informations et des vocabulaires de référence ».

Un seul critère « peut incorporer plusieurs concepts médicaux, qui ont des relations sémantiques de type conditionnelles ou temporelles ». Une mesure d’intersection est effectuée pour trouver les interdépendances entre les critères d’une étude.

Un cloud souverain pour soutenir une croissance « exponentielle »

Stane a fait le choix d’une infrastructure souveraine, et plus particulièrement le cloud public d’OVH. Une décision à l’opposé du choix initial des promoteurs du Health Data Hub.

 [OVHcloud] était le seul prestataire souverain qui proposait une offre de cloud public certifié HDS [hébergeur de données de santé, N.D.L.R.] au moment où nous avons pris notre décision ».
Dr. Antoine NeurazChief Data Officer, Stane

« C’était le seul prestataire souverain qui proposait une offre de cloud public certifié HDS [hébergeur de données de santé, N.D.L.R.] au moment où nous avons pris notre décision », affirme Antoine Neuraz. « Le cloud public nous permet de monter à l’échelle rapidement, nous n’avons pas trop de visibilité sur la vitesse à laquelle nous avons besoin de puissance de stockage et de calcul ».

Les structures de soins accompagnées par Stane rassemblent environ 1,7 million de patients. Autant de personnes qui peuvent potentiellement participer à une étude clinique. Sachant que chaque médecin a environ 20 Go de données patients.

Actuellement, Stane mène près de 20 études en médecine de ville et projette de réaliser cinquante études d’ici la fin de l’année. « C’est exponentiel. Plus nous aurons d’études proposées par des porteurs de projets, plus nous aurons de médecins qui souhaiteront nous rejoindre, plus le nombre d’études simultanées va croître », anticipe Mehdi Djelamani.

Les études en cours portent sur les dispositifs médicaux, notamment avec Apnea pour la détection de l’apnée du sommeil via smartphone, et sur la psychiatrie avec Calliope, qui développe une IA capable de détecter des biomarqueurs vocaux de la dépression. Elles incluent également des collaborations hospitalières en cardiologie, pneumologie, psychiatrie, santé mentale et santé de la femme, ainsi que des projets industriels en cardiologie et diabétologie.

Outre l’ajout de fonctionnalité d’IA, Stane prévoit de participer à des projets de fédération d’entrepôts de données, potentiellement avec des hôpitaux, SOS Médecins et des groupements de biologie de ville. « L’idée serait de pouvoir faire une requête, voire d’entraîner des modèles d’IA sur plusieurs entrepôts de données de santé sans avoir à déplacer les données », évoque Antoine Neuraz. Avec d’autres, Stane compte explorer plusieurs techniques, dont le chiffrement homomorphe et la confidentialité différentielle.

Pour approfondir sur Datawarehouse