Databricks et OpenAI : 100 millions de dollars pour une intégration « native »

GPT-5 est désormais le modèle principal pour les utilisateurs de la plateforme de données. De plus, les partenaires collaboreront afin d’améliorer les performances des modèles pour les applications concrètes.

Databricks a présenté la semaine dernière un partenariat pluriannuel d’une valeur de 100 millions de dollars avec OpenAI. Il s’agit de rendre nativement disponibles les modèles d’OpenAI à travers la plateforme de gestion de données et Agent Bricks, son studio de développement d’agents IA.

En outre, les deux partenaires entendent adapter en continu les LLM d’OpenAI aux applications métiers. GPT-5 deviendra la collection de modèles par défaut pour les usagers de Databricks lors du développement d’outils d’IA.

Les entreprises pourront utiliser GPT-5, GPT-5 mini et nano depuis des instances Databricks déployés sur AWS, Microsoft Azure et Google Cloud. Cette fonction est disponible en préversion publique limitée.

« Ce partenariat est remarquable, car c’est l’une des premières intégrations officielles d’OpenAI avec un fournisseur de plateformes de données », déclare Stephen Catanzano, analyste chez Enterprise Strategy Group d’Omdia [une filiale d’Informa TechTarget, également propriétaire du MagIT].

GPT-5 nativement sur Databricks, une première étape

« L’engagement de 100 millions de dollars suggère que cela va au-delà d’une intégration technique classique et pourrait potentiellement créer des expériences d’IA différenciées pour les utilisateurs de Databricks », ajoute-t-il.

La relation entre Databricks et OpenAI n’est pas exclusive, rappelle l’analyste.

Databricks prend en charge nativement ses propres modèles ainsi que ceux d’Anthropic, de Google et de Meta. Par ailleurs, Microsoft, qui a également conclu un partenariat avec OpenAI, héberge les modèles d’OpenAI dans son environnement Azure. SAP, Microsoft et OpenAI ont aussi scellé un accord pour exécuter les LLM d’OpenAI sur des data centers de Delos Cloud, une filiale de cloud souverain de SAP. Cette offre cible les administrations publiques allemandes.

De plus, des acteurs tels que Snowflake, AWS et Google Cloud proposent les réseaux de neurones d’OpenAI dans leurs suites de développement d’IA. Toutefois, ils ne disposent que d’intégrations natives avec les modèles open weight GPT-OSS d’OpenAI. Tout comme Databricks avant ce partenariat.

« Ce n’est pas réellement unique, mais Databricks infuse les LLM d’OpenAI afin que ses 20 000 utilisateurs puissent y accéder plus facilement », retient l’analyste d’ESG.

Selon Holger Mueller, analyste chez Constellation Research, Databricks gagne là un moyen de s’émanciper des fournisseurs cloud. « Si Databricks joue bien ses cartes, il deviendra la base multicloud pour les données et les modèles LLM des entreprises », interprète-t-il, dans un billet de blog. « Le multicloud a porté ses fruits à tous les niveaux de la pile, et il n’y a aucune raison pour que cela ne fonctionne pas pour Databricks. Ce qui est unique, c’est que cela touche davantage de couches de la pile ».

Une approche adoptée par son concurrent Snowflake.

De la suite dans les idées en matière d’IA agentique

L’effervescence créée par le lancement de ChatGPT en novembre 2022 a poussé de nombreuses entreprises à augmenter leurs investissements dans l’IA. En réponse, pratiquement tous les éditeurs et fournisseurs cloud se sont outillés pour permettre le développement d’applications GenAI.

Depuis début 2024, l’écosystème s’est concentré sur la conception d’agents d’IA semi-autonome. Agent Bricks, sortie en juin, est la dernière avancée en date dans l’environnement de développement de Databricks.

Selon Kevin Petrie, analyste chez BARC U.S., le partenariat entre Databricks et OpenAI vise à aider les clients de Databricks à développer des agents et d’autres outils d’IA de manière collaborative. Ce serait là la véritable valeur ajoutée.

« Ce partenariat permet aux équipes chargées des données, de l’IA et du développement de coopérer plus facilement pour optimiser leurs pipelines de données, leurs modèles d’IA et leurs applications agentiques », avance-t-il. « Et les entreprises ont besoin de toute l’aide possible, car il est compliqué et difficile d’intégrer l’IA dans leurs processus métier ».

Ce sont ces mêmes utilisateurs qui ont incité Databricks à collaborer avec OpenAI et à ajouter la disponibilité native des modèles OpenAI, selon Hanlin Tang, directeur technique des réseaux neuronaux chez Databricks.

« Nous avons constaté une demande massive de la part des clients… pour utiliser de manière native les modèles OpenAI sur la plateforme Databricks Data Intelligence et notre produit phare d’IA, Agent Bricks », assure-t-il.

Par ailleurs, selon M. Catanzano, la disponibilité native des modèles OpenAI pourrait aider le partenariat entre Databricks et OpenAI à se démarquer des accords conclus entre OpenAI et Snowflake et d’autres concurrents de Databricks.

Il est prévu que GPT-5 soit accessible via les API Foundation Model de Mosaic AI et Agent Bricks ou à travers des fonctions SQL pour classer, résumer, ou extraire des informations dans des tables.

Databricks a la possibilité d’intégrer les modèles OpenAI dans des fonctionnalités telles que son catalogue Unity pour la gouvernance, et de faciliter l’intégration des modèles avec les données propriétaires des clients. Pour l’instant, les API de Databricks incluent des fonctions de sécurité, de contrôle et de gouvernance des appels. Pas des données ou des applications.

« Les intégrations et les incorporations feront la différence », souligne Stephen Catanzano. « Ce que fait Databricks pour faciliter l’exploitation de ses capacités en matière de données et de gouvernance avec OpenAI, afin de prendre en charge les cas d’usage des clients, est la plus grande valeur ajoutée. Il en va de même pour Snowflake et d’autres. »

En fin de compte, les fournisseurs tels que Databricks et Snowflake se livrent à une course pour créer la plateforme de données idéale, poursuit-il.

« Cela fait partie de la course dans laquelle tous les clouds et les lakehouses sont engagés », déclare l’analyste d’ESG. « Si vous pouvez obtenir les premiers cas d’usage de l’IA, vous fidélisez ce client à long terme. Chacun ajoute des fonctionnalités supplémentaires, réalise des acquisitions et bien plus encore afin de pouvoir tout vous offrir. »

Alors que Databricks planifie les derniers mois de 2025, son objectif reste de simplifier le développement de l’IA, selon Hanlin Tang.

« Nous voulons permettre à tous nos clients de concevoir plus facilement des applications et des agents IA capables d’analyser avec précision les données de leur organisation », vante-t-il. « Les innovations à venir aideront les entreprises à atteindre un haut niveau de précision tout en conservant leur flexibilité et leur gouvernance ».

M. Catanzano, quant à lui, prévoit que Databricks poursuivra sa stratégie d’acquisitions agressive.

Si le développement interne de produits a contribué à la mise en place d’un environnement de développement de l’IA, des acquisitions telles que celles de MosaicML pour 1,3 milliard de dollars en juillet 2023, et de Neon pour 1 milliard de dollars en mai ont toutes ajouté des capacités visant à simplifier la création d’outils d’IA.

« Je pense que [Databricks] continuera à acheter d’autres sociétés », anticipe Stephen Catanzano. « OpenAI est un élément de la construction de solutions d’IA d’entreprise à partir de données d’entreprise ».

Pour approfondir sur IA appliquée, GenAI, IA infusée