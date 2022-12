En septembre dernier, Salesforce annonçait la disponibilité générale de Genie, une révision de sa Customer Data Platform (ex-CDP) pour faciliter l’ingestion et le traitement de données en temps réel en provenance de systèmes tiers.

En réalité, selon Roman Michalik, Principal Solution Engineer chez Salesforce, Genie est une nouvelle marque chapeau, « et non une solution unique ».

Sous son nouveau nom - Salesforce Genie Customer Data Cloud, et par raccourci Genie -, la CDP doit permettre d’ingérer les données en batch ou en streaming des produits Salesforce (Customer 360, Sales Cloud, Service Cloud, Commerce Cloud, etc.) et de logiciels tiers (plateforme d’emailing, données de navigation, données commerciales et marketing, données IoT, etc.).

Combler les défauts des CDP existantes Auparavant, avec Salesforce CDP, « Les clients devaient créer des pipelines de données pour déplacer les données hors de Salesforce, les répliquer dans une autre base de données, SQL Server, Snowflake, Amazon ou autre », indique François Ajenstat, Chief Product Officer chez Tableau. « Ils devaient ensuite reconstruire les modèles de données et les rôles de sécurité qu'ils avaient dans Salesforce. Et une fois qu'ils avaient fait tout cela, ces données n’étaient plus fraîches ». Avec cette méthode, les clients devaient « maintenir les pipelines en mouvement » pour conserver la fraîcheur des données. « Ce processus est complexe. Il prend du temps, il est coûteux et il est sujet aux erreurs. Il se casse tout le temps. Et donc les clients étaient frustrés par cela », relate François Ajenstat. Selon le Chief Product Officer, c’est pour cette raison que de nombreuses entreprises n’ont pas choisi de déployer une Customer Data Platform, et qu’elles ne veulent pas le faire, selon une étude commandée par Oracle. Pour éviter ces désagréments, Salesforce entend intégrer des capacités clés « au cœur de la plateforme ». Il s’appuie sur les capacités de streaming (plus précisément de microbatching) d’Apache Spark, ainsi que des connecteurs maisons, les API de MuleSoft et les solutions des partenaires référencés sur AppExchange pour ingérer les données. L’éditeur a de ce fait fourni les ponts vers sa plateforme et a automatisé une partie des pipelines de données. Plus tard, Salesforce compte proposer une fonctionnalité « sans copie » pour les données en provenance de Snowflake. Le « Data Cloud » dispose d’un système propriétaire de partage de fichiers s’appuyant sur des URLs. La fonction intitulée Open Data Access sera disponible dans la mise à jour Spring 2023. Ensuite, à la charge des clients de normaliser les données, de les relier à travers à un ou plusieurs modèles de données, de résoudre les identités des clients, en supprimer les doublons, avant d’automatiser des actions et d’analyser des activités. Là encore, l’éditeur prévoit d’introduire des recettes pour préparer et transformer les données dans la mise à jour Spring 2023 (dont le déploiement est prévu en février prochain). Au lancement de Genie en septembre, les données pouvaient être mises à jour toutes les 15 minutes. Pour certaines sources de données, cette latence a été optimisée afin d’obtenir les données en quelques millisecondes. « Quand vous pensez à certains cas d’usage, telle la personnalisation des offres, vous ne voulez pas proposer une offre dans 15 minutes, mais immédiatement », commente François Ajenstat.

Minimiser les mouvements de données Pour l’analyse des données en sortie de la CDP, Salesforce mise évidemment sur les solutions de Tableau. Ainsi, Salesforce a d’abord présenté des connecteurs Customer Data Cloud pour traiter les données depuis la plateforme analytique. Selon François Ajenstat, l’idée est de demander aux utilisateurs quelles données Salesforce ils souhaitent analyser, de les exposer directement dans Tableau et de mettre à jour automatiquement ces flux gérés par la plateforme Customer Data Cloud. « Toutes les règles de sécurité seront automatiquement appliquées. Il n'y aura plus de mouvement de données. Il n'y aura plus de transformation. Les données seront disponibles instantanément. Cela change la donne pour les clients », promet-il. Or, ce n’était pas vrai au lancement de Genie. « En septembre, nous avions présenté juste un connecteur pour Tableau Cloud à la plateforme Genie. L’on pouvait s'y connecter, cela fonctionnait, mais c’est tout », explique François Ajenstat. Si ces connecteurs permettent d’automatiser les flux de données de la CDP vers Tableau Cloud et CRM Analytics (CRMA, pour les intimes), l’affichage des données n’était pas immédiat et il fallait encore s’authentifier à chaque nouvelle connexion.

Plusieurs intégrations « natives » entre Salesforce Customer Data Cloud et Tableau En ce sens, Salesforce a dévoilé la disponibilité générale d’Access with One Click et d’Instant Analytics for CRM Analytics. « Cela permet de rendre les données de Genie immédiatement disponibles dans Tableau », vante François Ajenstat. Avec One Click, il faudra intégrer CRM Analytics à Salesforce CDP, mais cette fonction assure une authentification unique. Visuellement, l’interface utilisateur de Customer Data Cloud laisse apparaître les ficelles de Tableau, ses diagrammes et ses tableaux de bord. Ensuite, Instant Analytics doit accélérer la visualisation des données en provenance de Customer Data Cloud. En clair, la CDP n’était pas prête pour afficher les données en temps réel. « Nous avons pris une partie de la technologie de base de Tableau qui est intégrée dans Genie », indique le CPO. Plus précisément, Salesforce et Tableau ont intégré Hyper, le moteur in-memory de compilation et d’optimisation de requêtes de Tableau Server et l’ont placé par-dessus l’architecture Lakehouse qui anime Customer Data Cloud. Cela doit permettre d’accélérer les requêtes et les extraits sur de « de gros jeux de données complexes », selon la documentation de l’éditeur. Ainsi, avec Instant Analytics for CRMA est directement accessible depuis Salesforce CDP. Il est possible de glisser-déposer les données en provenance des sources mappés dans Salesforce afin de réaliser des tableaux de bord qui affichent des données actualisées en quasi-temps réel. De plus, l’intégration de Tableau avec les algorithmes d’Einstein permet de générer des « Data Stories », c’est-à-dire des explications en langage naturel des visualisations créées par les utilisateurs. Précisons qu’Hyper est gourmand en mémoire vive et que Salesforce n’a pas mentionné de quotas ou de limites quant aux volumes de requêtes ou de données pouvant être affiché de la sorte.