Melpomene - Fotolia

Data Platform : Semarchy pose les jalons d’un MDM à la mode DataOps

Avec le lancement de Semarchy Data Platform, le spécialiste du MDM franchit une nouvelle étape dans la modernisation de ses solutions. Une transition d’envergure pour lui, ses partenaires et ses clients.

Semarchy, éditeur américain d’origine française, prépare depuis deux ans l’unification de son produit MDM (Master Data Management), de son outil de gouvernance et de sa suite d’intégration de données. Cette initiative s’inscrit dans un contexte plus global.

Julien Peltier, SemarchyJulien Peltier,
VP Platform Success, Semarchy

« Il y a deux ans, nous avions deux produits existants : xDM, notre MDM, et xDI, notre suite d’intégration issue du rachat de Stambia. Nous venions de lancer notre solution de gouvernance en SaaS (xDG) », indique Julien Peltier, vice-président Platform Success chez Semarchy. « Nous nous sommes dit que nous devions arrêter de morceler les différents outils. Le marché migrait progressivement d’une approche “best of breed” vers une seule et même plateforme ».

Semarchy mesurait là le succès de Snowflake ou de Databricks. Ces deux acteurs « centralisent beaucoup de capacités autour de la gestion de données ».

Cette semaine, l’éditeur franchit une nouvelle étape. Semarchy lance officiellement une plateforme SaaS réunissant ses fonctions MDM et de gouvernance. « Nous sommes en train de travailler sur l’intégration de données, qui devraient être disponibles à partir de la deuxième partie de l’année 2026 », précise Julien Peltier.

Quand le MDM rencontre les approches DevOps et DataOps

Le socle de cette plateforme unifiée est d’abord celui de Semarchy Data Intelligence, l’autre nom de la solution SaaS xDG.

« En plus d’unifier nos outils, nous voulions proposer notre stack en SaaS tout en maintenant notre offre de déploiement privatif », explique le VP Platform Success. « Nous avons terminé la migration de xDM dans la plateforme, nous sommes en train d’améliorer quelques éléments de design ».

Ici, Julien Peltier ne fait pas référence à l’interface utilisateur. Il mentionne les outils de modélisation de données et de configuration des applications MDM.

« Là où nous avions un builder spécifique et une base de données, nous allons bénéficier de tous les avantages de VS Code et de Git », se réjouit-il.

« Là où nous avions un builder spécifique et une base de données, nous allons bénéficier de tous les avantages de VS Code et de Git ».
Julien PeltierVice-président, Platform Success, Semarchy

« Cela représente un énorme changement qu’il faut accompagner chez nos clients et partenaires », poursuit-il. « En revanche, il y a beaucoup d’avantages à Visual Studio Code. Cela nous permet d’être nativement compatibles avec les frameworks d’intégration et de déploiement continu ».

Ce modèle DevOps croise une vision DataOps où le MDM est amené à devenir le socle de gestion de produits de données. « Nous voulons sortir le MDM de son carcan pour en faire un framework d’entreprise. Il permettra de déployer et d’industrialiser des produits de données – versionnés, documentés, gouvernés –, mis à disposition des métiers depuis une place de marché centralisée », envisage Julien Peltier.

IA générative : Semarchy précise ses intentions

Dans cette approche, l’éditeur anticipe que l’IA générative sera d’une aide précieuse.

« Nous allons introduire des capacités d’IA via Copilot qui vont accélérer le design », souligne le responsable.

Pour l’instant, Semarchy ne fournit pas beaucoup de contexte spécifique aux Copilot de Microsoft. Le besoin ne s’en fait pas encore sentir. « À partir de fichiers Excel où l’on décrit le modèle de données, nous arrivons à créer un ensemble d’artefacts techniques permettant de déployer un projet », explique-t-il. « L’on ne veut pas s’arrêter là : nous avons dans notre feuille de route la construction d’un serveur MCP, afin de guider la génération en nous appuyant sur nos règles sémantiques et de validation ».

Un serveur MCP (Model Context Protocol) assurerait que Semarchy demeure agnostique en matière d’IA. « L’approche MCP nous permet d’exposer notre base de connaissances, d’instructions, sans avoir à accéder aux données des clients ou d’imposer un LLM ». Ce serveur MCP sera idéalement mis à disposition des clients avant la fin de l’année 2025. Informatica mise lui aussi sur cette technologie.

Pour les utilisateurs finaux, Semarchy imagine davantage un modèle de déploiement privatif. « Nous voudrions que le moteur d’IA puisse apprendre le modèle métier du client. Cela permettrait d’interroger les données en langage naturel. Ou d’assister les gestionnaires de données en suggérant des corrections de données de manière proactive », évoque Julien Peltier.

Ces pistes évoquées dès 2024 seront explorées l’année prochaine. « Nous avons également une réflexion sur l’AI Matching. Aujourd’hui, la solution s’appuie sur des règles déterministes, mais nous voulons proposer de l’IA générative en complément ou en remplacement selon les cas », expose le VP Platform Success.

Il s’agirait par exemple d’identifier plus fidèlement des doublons dans les informations disponibles sur des entités légales. Ce point sera ajouté à la feuille de route de l’éditeur en 2026.

Une période de transition sous le signe du SaaS

Avant cela, il faut terminer le chantier de l’unification des outils de MDM, de gouvernance et d’intégration de données.

« Il faut comprendre que l’année 2025 représente une période de transition », signale Julien Peltier.

Cette plateforme managée, « live » à partir de juillet, est officiellement commercialisée sur AWS, depuis le 9 septembre.

L’édition SaaS de Semarchy Data Platform sera ensuite disponible sur Microsoft Azure. « Dans un premier temps, nous cherchons à nous connecter aux lacs de Microsoft Fabric afin d’accéder directement aux données. Dans un second temps, nous verrons comment intégrer les briques de notre plateforme dans la philosophie Fabric ». Une deuxième phase qui réclame beaucoup de réflexions et de discussions.

En clair, Semarchy souhaite reproduire le schéma d’enchâssement de ces outils déjà opéré avec Snowflake. « Pour l’instant, nous proposons uniquement xDM sur Snowflake, en préversion. Nous avons des limitations techniques à lever avec la R&D de Snowflake, en matière d’optimisation et de sécurisation, avant de présenter un produit “Production Ready” ». 

Puis, il s’agira de proposer l’ensemble des briques de la Data Platform Semarchy sur Snowflake. « Cela nécessite que Snowflake nous propose des contextes d’exécution pour les briques de streaming et les bases de données que nous utilisons. Nous n’y sommes pas encore », prévient Julien Peltier.

La reproduction de ce schéma sur Databricks a été envisagée. Il n’est pas à l’ordre du jour.

« Nous essayons de voir comment le marché va évoluer en matière d’adoption des solutions comme Snowflake, Databricks et Fabric », déclare-t-il. « Il y a huit ans, nos clients nous poussaient pour investir sur le Big Data, heureusement que nous ne l’avons pas fait ».

Le lancement d’une offre SaaS sur GCP n’est pas non plus au programme. Auprès du MagIT, le responsable constate que les demandes des clients se concentrent sur AWS et Azure.

Déploiements self-managed et on premise : un différenciateur pour Semarchy

Contrairement à ses concurrents Informatica et Stibo Systems, Semarchy n’abandonne pas les déploiements sur site et cloud privé. « Nous travaillons avec des clients issus de secteurs stratégiques : la finance, le nucléaire, l’armement. Dans notre contexte, l’usage du SaaS y est souvent prohibé. Nous voulons continuer à prendre en charge ces clients », revendique Julien Peltier.

« Nous travaillons avec des clients issus de secteurs stratégiques : la finance, le nucléaire, l’armement. Dans notre contexte, l’usage du SaaS y est souvent prohibé ».
Julien PeltierVice-président, Platform Success, Semarchy

L’édition self-managed de la Data Platform doit être lancée au mois d’octobre. « Pour pouvoir basculer en mode SaaS, nous avons complètement changé l’infrastructure d’exécution de notre solution qui désormais s’appuie sur Kubernetes », informe Julien Peltier.

C’est ce même orchestrateur et les scripts associés qui permettront aux clients « self-hosted » de déployer la plateforme. Semarchy anticipe évidemment que ce choix demande un effort supplémentaire pour ses clients et partenaires intégrateurs.

« Pour certains clients, cela ne posera pas de problème, car ils ont des fermes Kubernetes et des experts en la matière », considère le vice-président. « Nous avons d’autres clients, souvent plus petits, chez qui cela pourrait induire des enjeux d’adoption ». 

Semarchy attend les réactions des clients concernés. Elles détermineront de potentielles adaptations en matière d’infrastructure cible. L’éditeur envisage aussi de leur recommander une migration vers son offre SaaS.

« Nous avons en tête de prendre en charge OpenShift », ajoute-t-il.

Pour l’instant, un packaging de la solution sur la plateforme de Red Hat ne semble pas au programme. « Nous sommes un peu embêtés sur ce sujet-là. Dans notre plateforme, il y a des composants propres à Semarchy et nous utilisons des briques que le client peut déjà avoir déployées : OpenSearch, PostgreSQL, Apache Kafka, etc. », relate Julien Peltier. « Nous ne voudrions pas imposer aux clients de refaire des instances dédiées à Semarchy dans Kubernetes. Nos usages de ces composants sont assez limités ».

D’autant que certains clients, notamment ceux du domaine bancaire, souhaitent conserver la maîtrise de la configuration.

« Il faut trouver un juste équilibre concernant le packaging de notre solution self-hosted ». D’où le lancement, cette semaine d’une phase bêta. « Nous commençons à expérimenter les déploiements en mode bac à sable afin d’obtenir des retours de la part de quelques clients », annonce le vice-président Platform Success. Semarchy a fait le choix de partir d’un Kubernetes « vanilla » (ou « vanilla » en anglais), il doit aussi tester ses schémas sur AKS, EKS et éventuellement GKE.

C’est le cas d’un client international qui a développé une soixantaine d’applications sur xDM. Celui-ci souhaite prendre à bras le corps ce projet de migration.

« Pour les grands clients, Kubernetes va plutôt apporter de la simplification en matière de mise à l’échelle, de redémarrage automatique des pods, et de gestion du failover », anticipe Julien Peltier. « À mon avis, cela va engendrer une réduction des coûts pour ceux qui ont Kubernetes à la maison. D’ailleurs, certains clients installent déjà xDM à l’aide de l’orchestrateur ».

Depuis mai, Semarchy forme ses clients et ses partenaires à ce nouveau contexte de conception et aux différentes options de déploiements.

« Nous avons également démarré en juillet des ateliers de découverte. Nous sensibilisons et nous récupérons des retours lors de sessions bihebdomadaires en français et en anglais. Nous aurons vu une centaine de personnes lors de ces workshops qui se terminent à la fin du mois de septembre. Cela représente environ 25 % de nos clients ».

En parallèle, au vu de la nature des changements, l’éditeur prolonge les fenêtres de support pour xDM et xDI jusqu’en 2029.

Des outils de migration seront mis à disposition d’ici à la fin de l’année. L’IA générative pourrait aussi contribuer à accélérer les migrations.

Pour approfondir sur MDM - Gouvernance - Qualité