M+Isolation+Photo - stock.adobe.

« API-first » : Altares tente de concilier intégration et qualité de données

Altares D&B France adapte petit à petit son infrastructure technologique aux demandes des entreprises. Une constante demeure : sa méthodologie pour mettre en qualité les données nécessaires à son activité de renseignement.

Ancienne filiale de Dun & Bradstreet qui a fusionné avec Base d’Informations Légales, Altares D&B France (130 millions d’euros de CA en 2023) s’est spécialisée dans le recueil et l’analyse d’informations sur les entreprises. Son rapport annuel consacré aux défaillances d’entreprises conduit par son directeur des études, Thierry Millon, fait référence.

Mais Altares est à la fois un agrégateur et un éditeur de produits de données. À ce titre, son objectif demeure de collecter des données, de les nettoyer, de les analyser et de les pousser à ses 3000 clients en France.

L’open data ne règle pas tous les maux

Ces dernières années, plusieurs éléments auraient pu perturber ses activités. En premier lieu, la Loi pour la République numérique du 7 octobre 2016 a rendu obligatoire l’ouverture par défaut des données à la disposition des services de l’État. En conséquence, des dizaines de services consacrés au renseignement financier sur les entreprises ont vu le jour. « Il y a toujours des bonnes volontés. Mettre à disponibilité des données est relativement facile. Mais les enrichir et les mettre à jour, ça coûte de l’argent. Et s’assurer que les données soient fraîches, ça coûte encore plus cher », signale Frédéric Paresy, Data Manager chez Altares.

Si la France est considérée comme la première de la classe en Europe en matière d’open data, tous les services de l’État ne sont pas exemplaires ou n’ont pas les mêmes obligations. « Heureusement, les registres officiels ont cette obligation d’actualisation », ajoute Frédéric Paresy.

L’autre sujet, plus récent, concerne l’émergence de l’IA générative. Elle a conduit à certains ajustements dans la pile technologique utilisée par Altares.

L’IA générative : un accélérateur, mais pas une révolution

« L’IA générative et toutes les nouvelles technologies n’ont pas révolutionné notre façon de faire », estime Maxence Buatois, head of product management chez Altares. « En revanche, ce sont des outils géniaux pour accélérer, faire plus et mieux ».

Par exemple, Altares avait mis en place des systèmes NLP à base d’entités nommées et d’analyse de sentiments pour identifier les entreprises en difficulté dans des articles de presse et les annonces légales (plan social, fermeture d’usine, redressement, etc.). Des opérateurs vérifiaient les éléments poussés à travers des alertes. Il remplaçait un procédé qui réclamait par le passé aux opérateurs d’éplucher les journaux quotidiennement.

Désormais, les modèles NLP ont été remplacés par des LLM. Si la vérification demeure manuelle, l’IA générative « réduit la zone de flou ». « Nous observons que les LLM sont nettement plus pertinents et performants, mais cela réclame toujours le regard d’un expert », confirme Frédéric Paresy. D’ailleurs, le fournisseur ne souhaite pas exposer des résultats fournis par de grands modèles de langage à ses clients. « Nous sommes frileux au regard des hallucinations », souligne-t-il.

C’est d’ailleurs le motto du Data Manager. « Désolé pour cette phrase un peu niaise, mais c’est l’expérience et la connaissance qui fait toute la différence », affirme-t-il.

Le nerf de la guerre pour Altares France demeure la mise en qualité de données issues d’environ 1000 sources différentes, dont les registres officiels (Infogreffe, INSEE, INPI, Bodacc, registre national des associations), les données légales privées (SHAL, Bilans Service, Amabis, etc.), les données contextuelles (Cedricom, Cofisem, open data, etc.) et les données exclusives, issues de Dun & Bradstreet, Creddel, Armadillo, le Dow Jones et Acuris.

Score de défaillance : les statistiques suffisent (la plupart du temps)

Altares enrichit et a accès à la base de données de son partenaire Dun & Bradstreet contenant près de 600 millions d’entités légales (12 millions en France) dans 220 pays. Dun & Bradstreet collecte également 2 milliards de transactions auprès de 15 000 entreprises afin d’estimer les délais de paiement moyen des organisations. Les données et les solutions des deux partenaires servent aussi à identifier les bénéficiaires effectifs et modéliser les liens capitalistiques des entreprises.

« Mon rôle est d’orchestrer avec les équipes de data science et des opérations data l’apport et l’optimisation des règles de qualité, de bonnes transformations et de bonnes interprétations des données », résume Frédéric Paresy.

La gestion de la qualité des données passe par la mise en place de traitement et de règles au sein d’ateliers installés au-dessus des entrepôts de données Oracle et Snowflake d’Altares.

Certaines de ces données (identité des entreprises, statut des dirigeants, actionnariat, éléments financiers, transactions financières, 1,5 million d’annonces légales par an, entre autres) servent à matérialiser des scores de défaillance, de survie à une procédure de sauvegarde ou de redressement ainsi que des indicateurs de risque de défaut de paiement.

« Les scores sont basés sur des éléments statistiques. L’historique des procédures et les paiements (en prenant en compte la saisonnalité) jouent beaucoup », indique Frédéric Paresy. Néanmoins, il insiste sur le fait que ces formules équivalentes à la recette du Coca-Cola restent secrètes. Il n’est pas impossible qu’Altares donne un jour les moyens à ses clients d'exécuter par eux-mêmes le scoring. Techniquement, c’est déjà possible. C’est pour l’instant jugé comme un risque. « Nos clients vont prendre des décisions en se basant sur ce score-là. Ça veut dire que tout score que nous exposons nous engage », explique Gabor Pop, directeur marketing chez Altares D&B France.

API et data marketplaces : moderniser la consommation des données

Si Altares propose plusieurs solutions et des portails Web pour les lignes métiers, la majorité de ses grands clients utilisent ses accès directs à ses instances FTP et SFTP, ainsi qu’à ses API REST, de plus en populaires. C’est l’un des chantiers du moment pour que les API servent « de la collecte à la mise à disposition des données ». « Nous avons beaucoup d’API historiques en mode SOAP et XML que nous avons déjà converti en REST », relate Frédéric Paresy.

« Nos clients apprécient nos API pour l’aspect transactionnel, mais de plus en plus l’analyse et le traitement de nos données passent par des plateformes », ajoute Maxence Buatois.

Le responsable produit remarque que de plus en plus de banques et de grands comptes adoptent Databricks, mais Altares ne veut pas faire de jaloux. Il propose des intégrations avec Snowflake et avec BigQuery pour les données en provenance de Dun & Bradstreet.

Nettoyer et activer les données des entités au sein du CRM

Outre les connexions vers S/4HANA et ECC via businessAdd-on, avec Dataxess, l’éditeur pousse une solution pour améliorer la qualité des données liées aux entités commerciales au sein de Salesforce.

Il ne s’agit pas de participer au nettoyage des « 20 à 30 % de données CRM caduques au bout d’un an », mais aussi de repérer les liens légaux et capitalistiques entre des entités potentiellement intéressés par les offres d’une entreprise.

« Normalement, la hiérarchie de comptes dans le CRM est manuelle », illustre Maxence Buatois. « Nous, en quelques clics, nous pouvons donner aux directeurs commerciaux une idée des opportunités au sein d’une entreprise avec qui elles ont déjà une relation commerciale ».

« C’est une offre assez simple à vendre une fois la démonstration faite », considère Gabor Pop. « Les entreprises ont un potentiel commercial enfermé dans leur CRM ».

Démonstration à l’appui, le responsable produit montre les liens entre les entités d’une entreprise, leurs données financières et les scores de risques associés. Ce deuxième aspect cible davantage les directeurs financiers et leurs équipes responsables de valider la contractualisation et les transactions.

Altares classe ce type d’offre dans la catégorie MDM de son catalogue. Elle entend aider les entreprises à réaliser ce nettoyage dans leur SI (ERP, CRM, SRM) afin de se conformer à la législation, cerner plus finement les risques financiers, détecter des opportunités commerciales ou, pourquoi pas, préparer les données pour les modèles d’IA.

Techniquement, Altares ne veut pour autant pas imposer ses briques sur étagère. « Notre métier, c’est de nous adapter au client, de comprendre ses enjeux, les informations dont il a besoin et en fonction de cela de recommander des intégrations », nuance Maxence Buatois. « Tous les clients sont différents. Nous déroulons plutôt une méthode : fiabiliser, enrichir et superviser les données liées à notre domaine d’expertise ».

Pour approfondir sur MDM - Gouvernance - Qualité