Salesforce serre les boulons de Data Cloud

Lors de Dreamforce 2024, le géant du cloud a mis tous ses efforts de communication sur l’infusion de l’IA générative dans sa plateforme. Pour autant, les mises à jour de Data Cloud semblent refléter les retours des clients qui commencent à l’adopter à l’échelle.

Si Salesforce a largement mis en avant Agentforce, il doit poursuivre le développement de Data Cloud.

D’abord parce qu’il doit accompagner le développement commercial de la plateforme de traitement censée servir de réceptacle de données pour la plupart des « clouds » de l’éditeur.

Pour cause, le nombre de clients payants ayant adopté la plateforme de données autrefois nommée Genie aurait crû de 130 % entre le premier trimestre fiscal 2025 et 2024.

Fedex, ADP, le groupe Adecco, ou encore Aston Martin sont parmi les premiers utilisateurs de cette couche de données.

C’est d’ailleurs, selon Marc Benioff, cofondateur et CEO de Salesforce, la fondation de l’ensemble des fonctions d’intelligence artificielle présentes dans Agentforce.

Pour autant, il manque quelques fonctions essentielles à une plateforme de données comme Data Cloud.

Par exemple, le géant du CRM n’avait pas réellement rempli sa promesse, car Data Cloud n’avait pas de réelles capacités… de temps réel. Pour ce qui est à l’origine un CDP, c’est un comble. Obtenir les données de visite d’un client en direct peut permettre d’activer des fonctions ou des promotions à l’instant afin de favoriser une vente.

D’où la disponibilité générale d’une couche d’ingestion, d’unification et d’analyse de données « sous la seconde ». Celle-ci est accessible pour les clients payant une extension. « Cette fonction est compatible avec les données structurées et non structurées », précise Gopi Prashanth, SVP Data Cloud chez Salesforce.

Par ailleurs, il est désormais possible de mettre à jour les transformations batch de manière incrémentale.

Unifier des données en provenance de sources hétérogènes

En parlant de sources, le géant du CRM dit avoir plus de 200 connecteurs pour Data Cloud, dont une centaine introduit dans la mise à jour Winter’25. Plus précisément, le répertoire de connecteurs de Data Cloud référence – au moment d’écrire ces lignes – 269 connecteurs, dont 118 en bêta et 143 en disponibilité générale.

S’il semble évident que Salesforce s’est d’abord concentré sur l’accès aux données marketing disponibles dans d’autres plateformes, dont Meta Ads, Google Ads, Mailchimp Marketing, il fournit également un ensemble de connecteurs vers des bases de données (Neo4j, MongoDB, PostgreSQL, RDS Oracle DB, etc.), des data lake (Hadoop, Snowflake, Databricks, etc.), des espaces de stockage (Azure Blob Storage, Amazon S3, etc.) ou encore des ERP (Microsoft Dynamics, NetSuite, SAP, etc.)

Ces connecteurs ne viennent pas de nulle part. Sans prendre en compte leur niveau de disponibilité, 127 d’entre eux sont des connecteurs préfabriqués en provenance de MuleSoft. Pour ceux-là, il faut donc souscrire à une licence à la plateforme MuleSoft Anypoint pour les utiliser. C’est la même condition qui s’impose aux clients souhaitant utiliser l’offre Mulesoft Direct for Data Cloud. Il s’agit d’une interface embarquée dans l’UI de Salesforce permettant de parcourir les intégrations préfabriquées, de les configurer et de les déployer.

Pas moins de 142 connecteurs sont « natifs » à Data Cloud, dont une vingtaine d’entre eux ont été rendus disponibles dans la version Winter’ 25 (SAP, Apache Hbase, Impala, Cassandra, Phoenix, LinkedIn Ads, Amazon Marketplace, Microsoft 365 Excel Online, etc.). La plupart d’entre eux sont en bêta.

Disposer de toute sorte de connecteurs est forcément un moyen de convaincre largement… et de potentiellement d’augmenter le panier moyen du client qui ne trouverait pas son bonheur dans les connecteurs natifs.

Une option permet par ailleurs d’ingérer des fichiers en mode « zéro copie », en s’appuyant sur des accès spécifiques aux données de certains systèmes. C’est le cas avec le partage d’objets Salesforce vers Amazon RedShift à travers des pointeurs.

« Vous avez beaucoup de données qui résident dans des silos. La première étape de l’unification de toutes ces données consiste donc à les rassembler, à les connecter et à les intégrer », assure Gopi Prashant.

En revanche, tous les connecteurs ne sont pas bidirectionnels. La majorité d’entre eux ne permettent que d’ingérer des données dans Data Cloud.

Aussi, contrairement à ce qu’affirmait Salesforce, il n’était pas possible d’affilier plusieurs Orgs Salesforce à une même instance Data Cloud. Le service Data Cloud One le permettra dès le mois d’octobre 2024.

De plus, la plateforme était jusqu’alors pensée pour les données structurées. Or l’emphase mise sur Agentforce et l’orchestration de l’IA générative, ainsi que la volonté d’analyser les relations clients ont poussé Salesforce à prendre en charge les données non structurées, dont les fichiers audio et vidéo. Ceux-là peuvent, entre autres, provenir de Microsoft Sharepoint, Google Drive ou encore de Box. Cette fonction est encore en pilote et devrait entrer en disponibilité générale dès le mois d’octobre.

Renforcer la sécurité et la gouvernance

Il semble crucial que les connexions avec des logiciels tiers soient sécurisées. En novembre, l’éditeur annoncera la disponibilité de Private Connect for Data Cloud. Le principe ? Établir une connexion sécurisée entre une instance Data Cloud et un espace de stockage de données dans le cloud protégé par un VPC. Salesforce propose déjà cette fonction entre AWS et les Orgs de son CRM. De même, le chiffrement des données au repos et en transit, ainsi que la gestion des clés de chiffrement par les clients sont fraîchement activés.

En parlant de sécurité, Salesforce comble un trou dans sa raquette en annonçant plusieurs fonctions de gouvernance. En bêta, il bêta ainsi question de mettre en place des règles en place en sus des mécaniques RBAC déjà en vigueur dans la plateforme Salesforce. Dans la mise à jour Winter 25, l’éditeur a introduit un mécanisme pour rendre immuables les métadonnées personnalisées, afin d’éviter leur modification ou leur effacement par des tiers. Il est aussi de séparer les métadonnées contenues dans Data Cloud de celles des Orgs.

En novembre également, la fonction de copie de données d’Orgs Salesforce dans des sandboxes (environnement de tests), qui doit simplifier les efforts des tests des développeurs, entrera en disponibilité générale.

Pour orchestrer la gouvernance des données et les développements d’applications dans et autour de Data cloud, Salesforce déploiera un centre de confidentialité (Privacy Center) et un autre consacré au DevOps (DevOps Center for Data Cloud). Ici, il s’agira de gérer les pipelines de données ou flux de transformation. 

IA et IA générative

Concernant l’IA, Salesforce maintient une feuille de route à deux volets. Il y a d’abord les fonctionnalités prédictives et de classification. Ainsi, un outil de segmentation automatique est en disponibilité générale, tout comme Ad Insights.

En octobre, Einstein Personnalization, une application associée à Customer 360 permettant de recommander des produits, des services ou des indicateurs à des usagers de Salesforce, sera connecté à Data Cloud. Ces recommandations peuvent avoir lieu en temps réel.

Par ailleurs, un système de classification et de labélisation automatique sera disponible en bêta au mois de novembre 2024.

Du côté de l’IA générative, les agents d’Agentforce disponible dans un mois pourront s’appuyer sur les données collectées dans Data Cloud. Mais de côté-là, les ingénieurs de Salesforce œuvrent principalement à la prise en charge de la vectorisation avec Vector Database, le RAG, avec Retriever Builder. Ce sont les évolutions des éléments présentés au MagIT en juin. Après une phase pilote, le mode de recherche hybride utilisant les index HSNW, Raptor et BM25 sera bon pour la production en novembre 2024.

« Il s’agit donc d’accéder aux données par mot-clé, par sémantique ou par la vectorisation », résume Gopi Prashanth. « Maintenant que ces couches d’accès sont construites, nous pouvons construire l’intelligence au-dessus pour accéder à ces données, où qu’elles soient, sous quelque forme que ce soit ».

Comme l’ensemble de ces fonctionnalités risquent de faire augmenter la facture de Data Cloud, Salesforce y intègre son Digital Wallet. C’est l’outil de supervision des coûts du géant du CRM et il mesure principalement la consommation de ressources de services de données, de stockage et l’utilisation des services Einstein, exprimées en crédits.

Pour approfondir sur Big Data et Data lake

Close