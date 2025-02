Après Red Hat en 2019 et alors qu’il n’a pas terminé l’acquisition de HashiCorp (malgré l’accord de l’autorité de la concurrence britannique obtenue ce jour), Big Blue a annoncé sa volonté d’acquérir DataStax pour un montant encore inconnu. « L’acquisition devrait être finalisée au cours du deuxième trimestre 2025, sous réserve des conditions de clôture habituelles et des approbations réglementaires », précise la communication d’IBM.

Pour rappel, DataStax est un éditeur de base de données fondé en 2010 à Santa Clara. DataStax est le fournisseur d’une distribution commerciale du SGBD NoSQL Apache Cassandra. Apache Cassandra est née dans les locaux de Facebook (Meta) avant d’être libérée sous licence Apache 2.0 en 2008.

Depuis l’éditeur a développé Langflow, un framework low-code et open source conçu pour bâtir des systèmes multiagents et des applications RAG. Selon Chet Kapoor, président du conseil d’administration et CEO de DataStax, Langflow serait utilisé par des « dizaines de milliers de développeurs ».

De son côté, DataStax a développé un ensemble de solutions, dont une distribution self-managed « hybride » (DataStax Enterprise) et un service DbaaS, AstraDB. Ces solutions sont utilisées par Netflix, Apple, Starbucks, FedEx, Capital One ou encore Verizon. AstraDB est pensée pour simplifier les déploiements de Cassandra, réputée pour sa complexité à large échelle.

Muscler watsonx.ai (et plus si affinité)

Si IBM et DataStax ont déjà coopéré par le passé (notamment pour déployer des solutions chez des clients comme Audi, T-Mobile, The Home Depot ou Intuit), ce sont bien ces efforts en matière d’IA générative qui motivent l’acquisition, selon Rikita Gunnar, directrice générale IA et données chez IBM. Il s’agit plus particulièrement d’infuser les briques de DataStax dans la plateforme watsonxai.

« L’acquisition stratégique de DataStax apporte à watsonx des capacités avancées dans la gestion des données non structurées et semi-structurées […] », affirme Rikita Gunnar, dans un billet de blog. « Elle permet ainsi aux clients de moderniser leurs systèmes et de développer les applications d’IA de prochaine génération », poursuit-elle. « L’infrastructure de données nécessaire à l’IA ne se résume pas aux seuls vecteurs : de nombreuses modalités de données – JSON, séries temporelles, clé/valeur, tabulaires, graphes – doivent être intégrées pour garantir une ingestion et une recherche de données précises et pertinentes. En regroupant ces éléments dans une solution simplifiée et évolutive grâce à l’IA générative, les utilisateurs n’ont plus besoin de rassembler manuellement différentes représentations de données pour exploiter pleinement la valeur de leurs données d’entreprise », vante-t-elle.

En résumé, il s’agit d’intégrer AstraDB, DataStax Enterprise et LangFlow à watsonx, ainsi que d’y apporter des capacités de traitement vectoriel et de GraphRAG.

Ce ne serait que la pointe de l’iceberg, selon Doug Henschen, analyste chez Constellation Resarch. « Le communiqué de presse aborde principalement les possibilités autour de l’IA générative », écrit-il. Or, l’éditeur n’a introduit le stockage des vecteurs et la prise en charge des embeddings que depuis l’année dernière. « La plateforme sous-jacente est solide et orientée vers des déploiements massifs à l’échelle mondiale ».

Toujours selon Doug Henschen, DataStax a dû faire face à la concurrence accrue de la part des fournisseurs cloud publics, en premier lieu AWS. Celui-ci propose DynamoDB, une autre base de données NoSQL et Amazon KeySpaces, une solution basée sur Cassandra. Couchbase, qui a récemment annoncé une intégration avec les services NIM de Nvidia, et MongoDB, qui vient d’annoncer le rachat du spécialiste de la recherche sémantique Voyage AI, sont quelques-uns des concurrents les plus visibles de DataStax sur la scène NoSQL.