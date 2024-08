Srinivas « Srini » Tallapragada est président et chief Engineering Officer chez Salesforce. Il est responsable de la plateforme, des applications, de la disponibilité de service et de la sécurité des solutions Salesforce. L’homme qui travaille pour le géant du CRM depuis douze ans est l’un des architectes en chef d’Hyperforce et de Data Cloud. Avec LeMagIT, il est revenu il y a deux semaines sur les fondements d’Hyperforce, une architecture censée réunir l’infrastructure de plusieurs « Clouds » Salesforce, à savoir des applications telles que Commerce Cloud, Sales Cloud ou encore Marketing Cloud. Il s’exprime notamment sur la gestion de la confidentialité des données et la sécurité de cette architecture sur laquelle « plus de 80 % » des clients de Salesforce auraient migré. Selon l’intéressé, la « résidentialité » des données (c’est-à-dire la possibilité de choisir la région cloud dans laquelle les données sont stockées et traitées) ainsi que la gestion externalisée des clés de chiffrement couvrent 95 % des besoins des clients.

Néanmoins, pour certains pays et secteurs régulés, Salesforce étudie (encore) le moyen de proposer des solutions légales qui protégeraient ses clients des effets des lois extraterritoriales. Cette réflexion germait déjà au lancement en disponibilité générale d’Hyperforce, en 2022.

Srini Tallapragada revient également sur les choix techniques concernant l’architecture de données « Data Cloud » de Salesforce, ainsi que les ambitions techniques du groupe en matière d’IA générative.

Le monde évolue, tout comme la technologie, et avec l’essor des données que nous anticipions, nous avons ressenti le besoin de renforcer la sécurité, la protection de la vie privée et la conformité. C’est en tenant compte de ces exigences et s’appuyant sur différents fournisseurs de cloud que nous avons lancé Hyperforce, notre nouvelle couche transversale. Elle garantit la conformité, la gestion de la résidentialité des données, et nous a également permis de repenser et de reconstruire notre plateforme. Nous avons revu toute notre architecture de données, incluant nos produits traditionnels et notre « Data Cloud », ce qui nous a permis de nous orienter vers l’IA et d’intégrer toutes nos applications. Après plusieurs années d’efforts, plus de 80 % de nos clients sont désormais sur Hyperforce, et à mesure que nous continuons à migrer nos clients, notre objectif est de progressivement fermer nos centres de données « first party ».

Srinivas Tallapragada : Je pense que nous avons été le premier fournisseur de cloud il y a 20 ans. Quand nous avons commencé, il n’y avait pas d’hyperscalers. Nous construisions nos propres centres de données, mais nous ne vendions jamais notre infrastructure. Nous ne vendions que la couche applicative. Nous avons toujours fait abstraction de cela pour nos clients. Et nous le faisions dans le monde entier. Au fil du temps, nous nous sommes rendu compte que ces fournisseurs de clouds publics investissaient beaucoup dans leurs infrastructures. Aussi le monde est devenu de plus en plus compliqué. Nous savions qu’un grand nombre de pays allaient adopter des lois sur la résidentialité des données. Dans un grand pays comme la France, nous pouvions investir dans un grand centre de données, mais pour les petits pays, cela devient un problème.

Hyperforce est donc la couche que nous avons développée pour gérer cette complexité. Actuellement, elle prend en charge nos data centers « first party », et la majorité de nos charges de travail sont sur AWS. Nous explorons également différents fournisseurs d’infrastructure, avec pour objectif d’abstraire cette couche. Ainsi, si un client (comme certains commerçants qui considèrent AWS comme un concurrent) exprime des préoccupations, nous pouvons lui offrir une solution. Pour l’instant, ces clients sont hébergés sur notre infrastructure interne, mais à long terme, nous prévoyons de prendre en charge d’autres fournisseurs.

C’est particulièrement le cas en France, qui est un marché important pour nous. Nous avons essayé de trouver des solutions techniques et nous essayons de comprendre s’il faut intégrer l’aspect juridique, et si c’est le cas, comment le faire.

Jusqu’à présent, nous considérons que la combinaison de la résidentialité des données et d’une gestion des clés de chiffrement externe à la plateforme Salesforce couvre 95 % des cas. Pour les 5 % restants, nous discutons avec les clients concernés, en provenance des marchés les plus réglementés.

Srini Tallapragada : Oui, en France, nous avons déjà beaucoup de clients sur Hyperforce et un bon nombre d’entre eux adoptent Data Cloud. Et nous sommes en train de migrer les plus grands clients vers la plateforme .

L’open source au cœur de la machine Salesforce

LeMagIT : Quelles technologies sont utilisées sous le capot pour propulser Hyperforce ?

Srini Tallapragada : Nous avons toujours affirmé que les données de nos clients ne font pas partie de nos produits. Elles sont toujours accessibles et intégrables. Si Salesforce n’était qu’une simple application, elle aurait pu être facilement remplacée. Ce que beaucoup ne réalisent pas, c’est que nous offrons une plateforme ouverte, permettant aux clients une grande liberté d’action.

Sous le capot, nous nous appuyons sur des technologies open source. Lors de la création d’Hyperforce, dès le départ, nous avons utilisé des technologies comme des systèmes de stockage de blobs ouverts, ou Iceberg pour la gestion des tables. Notre base de données transactionnelle est basée sur PostgreSQL, et nous utilisons Kubernetes pour les conteneurs, ainsi qu’Istio et l’architecture Service Mesh pour la communication interprocessus. Nous faisons appel à Apache Kafka pour la gestion des messages.

Dans tous ces domaines, deux points ressortent. D’abord, nous sommes de fervents utilisateurs de l’open source, et nos ingénieurs figurent souvent parmi les principaux contributeurs, car nous croyons en l’importance de redonner à la communauté. Nous utilisons, améliorons et partageons ces technologies.

Cela nous permet de garantir une évolutivité optimale. Chez Salesforce, nous avons une plateforme unique qui s’adapte aussi bien aux petites entreprises qu’aux grandes multinationales et aux industries réglementées. Nous avons une seule base de code, ce qui nous permet de déployer des mises à jour régulières et uniformes pour nos 300 000 clients.

Par exemple, il y a quatre ans, nous avons imposé l’authentification multifacteur (MFA) à nos clients, même s’ils étaient réticents (nous étions parmi les premiers à le faire il y a quatre ans), car notre priorité est de les protéger. Nous voulons qu’ils se concentrent sur leur activité, sans se soucier de la sécurité, qui est notre responsabilité.

Avec Hyperforce, nous offrons une solution à grande échelle, que j’appelle la couche de confiance, incluant l’authentification, l’autorisation, la surveillance, et même l’optimisation des performances. Tout cela grâce à l’intégration de l’IA (plus particulièrement de l’AIOps), ce qui assure à nos clients un service fiable et sécurisé.

LeMagIT : Pouvez-vous expliciter les choix techniques de Salesforce concernant Data Cloud ?

Srini Tallapragada : Dès le début, nous avons identifié deux défis principaux.

Le premier est que la quête d’une vue à 360 degrés des données a toujours été difficile. Pendant 25 ans, beaucoup d’entre nous ont essayé de réaliser ce concept, mais les technologies de l’époque avaient leurs limites. Les entreprises ont testé plusieurs approches, notamment les entrepôts de données et, plus tard, les lacs de données avec l’avènement du cloud public. Bien que ces lacs aient permis de centraliser les données, leur utilisation quotidienne reste souvent limitée pour les équipes marketing ou métiers.

Deuxième défi, la nouvelle génération d’entrepôts de données – bien qu’elle ait résolu certains problèmes en séparant le stockage du calcul – a introduit des formats propriétaires, verrouillant les données dans des systèmes fermés.

C’est pourquoi nous avons choisi une approche radicalement ouverte dès le départ. Nous avons opté pour des formats de stockage et de table ouverts, tels que Parquet et Iceberg, permettant une fédération des requêtes et créant ainsi ce que nous appelons l’alliance zéro copie. Cette technologie sous-tend la création du Data Cloud, une plateforme de données active, évolutive, flexible et ouverte, capable de libérer les silos de données et de générer des indicateurs exploitables, qu’ils soient structurés ou non.

Cette approche a séduit des partenaires comme Workday, car elle permet de préserver les investissements existants tout en débloquant la valeur des données piégées.

En outre, nous avons rapidement compris que la révolution de l’IA générative repose sur le contexte, les requêtes et l’ancrage. Pour déployer un système RAG (retrieval-augmented generation), une entreprise a besoin d’exploiter ces propres données. Il est donc essentiel que ces données soient dans des formats ouverts et accessibles de manière fédérée, car c’est le contexte que vous devez fournir. Cela relie, par exemple, notre couche Hyperforce à notre couche de données. La couche de données Data Cloud, elle, est liée à notre couche RAG, qui, elle-même, se connecte à notre couche d’IA. De plus, il est important d’avoir des API pour accéder à tous ces agents.

Cela offre une interopérabilité totale sans obliger les entreprises à tout reconstruire. Notre mission est de faciliter le travail de nos équipes et de nos clients en leur fournissant des technologies ouvertes, flexibles et prêtes à l’emploi. Tout est interconnecté pour atteindre cet objectif.