japolia - Fotolia

Comment Doctolib a soigné les maux de sa gouvernance de données

En migrant vers un nouveau catalogue de données, Doctolib est passé de la défense à l’attaque sur la gouvernance des données. Cette offensive place la découvrabilité et l’autonomie des utilisateurs au cœur des usages.

Doctolib cible de deux populations : les soignants et les patients. Ce qui se traduit par une suite de produits numériques : des outils de gestion de la relation patient (PRM), des solutions cliniques et financières pour le suivi des dossiers et la facturation, ainsi qu’une messagerie sécurisée pour les professionnels de santé.

Son portefeuille applicatif génère un volume de données considérables. Doctolib gère 80 millions de dossiers patients et les données de 400 000 professionnels médicaux. Dans ce contexte, mais aussi pour des raisons réglementaires (RGPD), disposer d’une vision claire de la gouvernance des données était une nécessité.

Une gouvernance à la fois défensive et offensive

En matière de Data Gouvernance, Doctolib mène des actions sur deux fronts.

Le premier est défensif. Il constitue le socle fondamental de la gouvernance, centré sur la protection, la conformité réglementaire et le maintien de la confiance. Cet aspect est « non négociable » pour Doctolib, comme le soulignait Diana Carrondo, Data Governance Lead, lors de Big Data 2025.

La gouvernance peut toutefois être pilotée de manière offensive. C’est sur cet axe que Doctolib cherche à innover. L’objectif est de positionner l’équipe gouvernance comme un partenaire interne, un « consultant ».

La mission est alors d’aider tous les collaborateurs à « livrer de la valeur avec la Data ». Pour cela, des objectifs précis doivent être atteints : rendre les données accessibles, faciles à découvrir et favoriser l’autonomie des utilisateurs pour la prise de décisions. Dans cette stratégie offensive, le catalogue de données est un outil central… à condition d’être performant et bien exploité.

Les limites de l’ancien catalogue

Doctolib disposait déjà d’une solution de ce type. Toutefois, elle était considérée comme un frein plus qu’un atout.

Trois problèmes motivaient une migration. Premier frein : le processus de classification des données sensibles reposait sur un étiquetage manuel, colonne par colonne, par les différentes équipes produit. Le système avait pour inconvénient d’être « très fastidieux » et « pas scalable ». Or, la volumétrie de données chez Doctolib requérait une gouvernance « intégrée, prouvable et traçable ». Le manque de traçabilité sur les modifications et l’ownership des données était un risque jugé inacceptable.

Diana Carrondo épinglait ensuite le manque de visibilité sur les données, c’est-à-dire le lineage de bout en bout. Pour les équipes Data, impossible de mesurer l’impact de leurs modifications, avec un risque de « casser » des produits ou des tableaux de bord. Pour les consommateurs de données, l’incertitude était problématique. D’où provenait l’information dans un rapport ? S’agissait-il de données issues du produit ou du CRM ? Ce manque de vision complète du parcours de la donnée freinait l’innovation et la confiance.

Enfin, la faible adoption du catalogue (moins de 100 utilisateurs mensuels) et son coût ont participé à son éviction. L’outil, peu « user friendly », restait confiné à un cercle d’experts. Pour la petite équipe chargée de la Data gouvernance (moins de 5 personnes), la maintenance, la communication et l’onboarding des utilisateurs gâchait un temps précieux. L’ancien catalogue était dès lors devenu un « expensive burden ».

Évaluation en mode agile et migration méthodique

Pour sélectionner une nouvelle solution (Coalesce Catalog, anciennement CastorDo) et garantir son alignement avec les besoins, le projet s’est déroulé en quatre étapes clés.

Le Proof of Concept (PoC), d’abord. Une phase de test de deux à trois mois a été menée. Elle associait les équipes data, mais avec une communauté de « bêta-testeurs » issus de toute l’entreprise (engineering managers, product managers). Cette approche visait une évaluation complète et centrée sur l’utilisateur final.

Puis la préparation et la migration. À ce stade, le principal défi a été logistique, avec la fin du précédent contrat comme « hard deadline » fin décembre 2024. Doctolib a du mobiliser ses équipes achat, sécurité et IT durant la période estivale et planifier soigneusement la migration de la documentation existante.

La négociation avec l’ancien partenaire a constitué la troisième étape. Diana Carrondo évoque avec humour la « breakup belly dancing », c’est-à-dire la nécessité de sécuriser la migration avec le nouveau partenaire avant d’annoncer la fin de la collaboration avec l’éditeur précédent. La relation s’est néanmoins terminée de manière « professionnelle ».

Enfin, le déploiement en janvier 2025 s’est accompagné d’une campagne de communication interne « assez agressive » autour de sa valeur, pour les collaborateurs, afin d’assurer une visibilité maximale au nouvel outil.

Plus en amont, la Data Gouvernance a dû convaincre le leadership de valider le changement. Or la gouvernance des données tend souvent à être perçue comme un centre de coûts et de contraintes.

Pour décrocher un sponsoring, une grille comparative a été mise au point. Elle établissait la supériorité de la nouvelle solution sur le plan fonctionnel, avec « plus de trois points d’écart » par rapport à l’ancien outil.

Autre constat : un avantage « bien au-delà », sur le plan technique, vis-à-vis de la concurrence. Des atouts auxquels s’ajoutaient une meilleure intégration à la stack existante et une sécurité renforcée, le tout sans aucun surcoût par rapport au précédent outil de catalogage des données.

Adoption massive et gouvernance offensive renforcée

Selon Diana Carrondo, les promesses faites ont été dépassées, avec des bénéfices concrets et quantifiables dès les premiers mois. À commencer par l’adoption. Le nombre d’utilisateurs a bondi, passant de moins de 100 à une moyenne de 330 utilisateurs actifs mensuels.

La simplicité d’utilisation aurait rendu les sessions d’onboarding quasi inutiles, avec des collaborateurs très rapidement autonomes, souligne la spécialiste.

L’automatisation des processus de gouvernance représente une autre avancée, et elle ne tient pas seulement à l’outil. Le changement de logiciel a servi de « super prétexte » pour faire évoluer les pratiques chez Doctolib. Le fastidieux étiquetage manuel des données sensibles a été abandonné au profit d’une catégorisation directement dans le code. Cette méthode rendrait le processus traçable, scalable et beaucoup moins sujet aux erreurs.

L’équipe Data Gouvernance a par ailleurs repensé son mode de pilotage. Les métriques issues du catalogue (taux de documentation, couverture du lineage, etc.) alimentent directement les indicateurs de performance (KPI) de l’équipe. Elle peut ainsi mesurer son impact et prioriser objectivement ses efforts.

Prochaines étapes : intégration de l’IA et des Data Products

Doctolib se projette à présent sur de nouvelles démarches pour faire de son catalogue de données un outil encore plus stratégique. Diana Carrondo liste trois évolutions en ce sens, dont des travaux au niveau des couches sémantiques. Le but ici est de créer un pont clair entre les assets techniques (tables, colonnes) et les concepts métiers (patient, rendez-vous).

L’entreprise prévoit également d’exposer les Data Products au sein du catalogue, dans une logique de Data Mesh. Il s’agit de permettre aux collaborateurs et aux squads de découvrir et de consommer des produits de données finis et documentés.

Enfin, pour faciliter encore l’adoption et la consommation de données, la gouvernance se prépare à intégrer de la recherche en langage naturel et poser des questions au catalogue via des prompts.

L’exploration de standards comme le « Model Context Protocol » (MCP) visera par ailleurs à connecter le catalogue à des outils d’IA comme Dust, une plateforme interne déjà largement adoptée et déployée.

Doctolib estime en tout cas désormais disposer d’un lineage lisible, et de bout à bout, et avoir soigné les maux de sa gouvernance de données.

Pour approfondir sur MDM - Gouvernance - Qualité