NicoElNino - stock.adobe.com
MDM : Semarchy modernise ses flux de travail
Le plus lyonnais des spécialistes américains du MDM a annoncé mi-janvier la mise à jour 2023.1 de son produit xDM. Elle est la première d’un nouveau cycle de livraison trimestriel et marque l’introduction des workflows « data-driven ».
Depuis le rachat de Stambia en septembre 2021, Semarchy se présente comme l’éditeur d’une plateforme de données unifiée, une plateforme constituée de deux modules phares. D’un côté, il y a xDM, son MDM. De l’autre, il mise sur xDI, l’ELT/ETL apporté par Stambia. La plateforme est généralement utilisée pour construire ce que Semarchy appelle des Data Hub.
L’éditeur avait décidé d’aligner le nommage et le développement des deux produits. Semarchy avait introduit la version 5.3 de xDM et de xDI. Il poursuit sur sa lancée en passant d’une à quatre mises à jour majeures par an.
« En ce début d’année, nous avons pris le parti d’adopter un cycle de sortie trimestrielle », indique François-Xavier « FX » Nicolas, Chief Product Officer chez Semarchy. « L’équivalent de la version 6 de xDM et de xDI s’appelle désormais 2023.1. Ce changement est couplé avec une notion de support à court et long terme (mainstream release et long term release) ».
Bien souvent, les éditeurs décident d’adopter une cadence de sortie trimestrielle en prévision d’une introduction en bourse. C’est typiquement ce qu’a fait MariaDB avant de lancer son IPO.
« Nous n’avons pas ce type de contingence », avance François-Xavier Nicolas, sourire aux lèvres. « Ce cycle trimestriel est rassurant pour les clients. C’est important pour eux d’avoir de la visibilité sur ce que nous proposons, car ils préparent leurs plans de vol sur la base des nôtres ».
Les flux de travail « data-driven » de xDM
En tout cas, Semarchy a bien tenu sa promesse effectuée l’année dernière. En mars 2022, le Chief Product Officer annonçait qu’il planchait sur le développement de « workflows data-driven », un dispositif à la croisée du BPM et du MDM.
C’est la principale fonctionnalité introduite dans xDM 2023.1. Pour les métiers, elle est accessible via l’onglet Workflow Builder du module. L’interface no-code, inspirée par le modèle BPMN, doit permettre de construire des flux automatisés de gestion de données produit.
« Nos clients dans le domaine du retail, qu’ils soient commerçants ou fournisseurs, ont besoin de mettre en place des flux de travail complexes », explique François-Xavier Nicolas. « Ce sont des workflows répondant à des effets de parallélisme, où plusieurs équipes travaillent simultanément sur les mêmes ensembles de données et à des besoins de routage ».
Dans cet outil, un flux de travail est composé « d’une chaîne d’étapes interconnectées qui détermine qui, où et comment un enregistrement doit être déplacé dynamiquement jusqu’à ce qu’il soit prêt à être consommé pour un cas d’usage spécifique », décrit Semarchy sur son site Web. Chaque flux commence par un point de départ défini par des métadonnées et un contexte. Un flux peut avoir plusieurs événements déclencheurs qu’il faudra configurer.
Ainsi, un événement peut déclencher une « tâche utilisateur » réclamant l’intervention d’un métier ou d’une équipe pour enrichir ou valider les données.
En clair, la fiche d’un même produit peut être soumise à validation en France et aux États-Unis, par exemple, s’il est vendu dans ces deux pays.
Les workflows data-driven peuvent répondre à d’autres cas d’usage. Par exemple, une équipe responsable de la création d’un produit dans un Hub MDM peut vouloir transmettre des flux aux équipes marketing et vente pour qu’elles remplissent les champs correspondant à leur domaine fonctionnel.
Pour ce faire, le « routeur » permet de définir des conditions appliquées aux métadonnées (localisation, horaires, auteur, nom, description, etc.). Ces conditions sont exprimées en SemQL (le langage de règles de Semarchy). Le rôle du routeur est de déplacer les données vers différentes branches. Ces branches peuvent être connectées à des blocs de parallélisation. Ceux-ci définissent des branches parallèles afin de soumettre les données à validation ou à enrichissement sur plusieurs étapes par plusieurs équipes.
Une quarantaine de types de flux pris en charge
Par ailleurs, xDM peut enrichir ou classer automatiquement certaines informations. Plus tard, Semarchy proposera la possibilité d’automatiser l’envoi de notifications par mail ou par SMS, la modification des enregistrements et des métadonnées, ou encore l’appel à des API tierces.
Ainsi, l’outil doit permettre aux transporteurs de construire des chaînes de validation suivant le type de produit à transporter et le lieu de livraison. Cet usage de Workflow Builder correspond à de l’approbation en cascade, de la validation de tiers, souvent utile dans un contexte réglementaire strict, ajoute « FX » Nicolas.
Selon le Chief Product Officer, le moteur de gestion des flux « permet de manipuler les données master de manière générique. Cela peut s’appliquer potentiellement à la gestion de données client ».
L’interface de Workflow Builder doit favoriser la collaboration entre les équipes IT et métiers ainsi que d’assurer une meilleure gouvernance des données, d’après l’éditeur.
Les métiers consultent leurs tâches en cours et à faire à l’aide d’un tableau de bord. Semarchy avait déjà un moteur pour gérer des flux de travail similaires, mais celui-ci ne disposait pas d’une interface no-code, ni des routeurs et du parallélisme. « Plusieurs de nos clients ont déployé la version 2023.1, car nous avons lancé un programme EAP en septembre dernier », avance François-Xavier Nicolas. « Pour l’instant, les clients n’ont pas mis en production les flux data-driven. Ils côtoient les workflows existants ».
François-Xavier NicolasChief Product Officer, Semarchy
Dans un premier temps, Semarchy a travaillé en collaboration avec quelques clients afin de déterminer quels modèles de workflows ils souhaitaient implémenter. « Nous couvrons actuellement une quarantaine de types de workflows différents », affirme François-Xavier Nicolas.
« Toute la forme du workflow va être déterminée par la donnée qu’il porte », explique le Chief Product Officer. « Dans les moteurs de BPM, souvent, l’on est capable d’agrémenter le processus. En revanche, diriger les processus en utilisant la donnée portée dans le processus, je pense que nous sommes les seuls à le proposer », avance-t-il.
Avec son infrastructure Data Fabric, Appian semble développer une fonctionnalité similaire, mais l’éditeur propose avant tout une plateforme BPM - Low-code/no-code et non une suite MDM. Dans le cas de Semarchy, les workflows sont des structures de données activées à leur exécution. Les workflows « data-driven » prennent en charge les enregistrements existants dans le MDM.
Pour accompagner ce moteur de flux, l’éditeur a ajouté des fonctions de gouvernance et de contrôle des champs modifiables. Il est également possible d’affiner les politiques de rétention de données. En mars prochain, dans sa mouture 2023.2, Semarchy ajoutera la compatibilité de son MDM avec plusieurs data catalogs du marché, pour assurer une forme de data lineage.
Toujours plus cloud, mais pas encore de SaaS
La plateforme dorénavant établie sur Java 11 est disponible sous la forme d’images Docker Hub. L’éditeur propose aussi des scripts de déploiements pour les différentes distributions Kubernetes des fournisseurs cloud, à commencer par AWS et Azure. Le script de déploiement pour GKE (GCP) sera présenté dans la version 2023.2, en mars prochain.
François-Xavier NicolasChief Product Officer, Semarchy
« Nos clients s’attendent à ce que nous exploitions pleinement les fonctions d’identification, de gestion de secrets, de stockage, etc. des fournisseurs cloud », assure le Chief Product Officer.
En revanche, Semarchy ne propose pas de versions managées de sa plateforme ni de versions SaaS. « La plupart de nos clients déploient nos solutions sur le cloud, mais pas encore en SaaS, c’est une réflexion en cours chez nous », explique-t-il.
S’il se concentre principalement sur les fonctionnalités liées au cloud, comme le prouve la prise en charge dans xDI de Google Cloud Storage et d’un sérialiseur/désérialiseur pour l’intégration des données JSON en colonnes dans Snowflake et BigQuery, Semarchy n’oublie pas ses utilisateurs on premise. Ils ont désormais accès à une fonction de Change Data Capture native sur AS400 (!) et des connecteurs vers Couchbase, Actian Avalanche, SQreamDB ou encore Azure Table Storage.
Pour l’heure, l’éditeur œuvre à convertir ses clients disposant de licences perpétuelles vers des offres en abonnement. « Nous essayons autant que faire se peut d’emmener les clients vers ce modèle à la souscription, notamment pour simplifier la gestion des clients licenciés et pour leur proposer de nouvelles fonctionnalités », indique le responsable produit.