SingleStore prépare sa base de données à la montée en charge de l’IA
SingleStore emprunte les mêmes voies que Databricks et Snowflake. Bien qu’il puisse déjà jouer sur son atout translytique, ses rivaux ont une feuille de route IA un peu plus avancée. L’éditeur californien compte bien rattraper son retard cette année.
En comparaison de ses concurrents Snowflake, Databricks, Oracle ou MongoDB, SingleStore est un acteur de niche.
L’éditeur basé à San Francisco s’est toutefois taillé une réputation de fournisseur de fournisseurs. Sa base de données in-memory hautement distribuée a fait ses preuves dans des cas d’usage quasi-temps réel. Elle est déployée dans les secteurs financiers, des télécoms ou encore du streaming vidéo.
Afin de satisfaire ses ambitions, SingleStore porte les mêmes enjeux que ses adversaires. Il veut attirer de plus en plus de volumes de données sur sa plateforme, se conformer à la volonté d’interopérabilité de ses clients, et prendre en charge les applications d’IA.
Pour rappel, ces deux dernières semaines Databricks et Snowflake ont annoncé avoir renforcé la prise en charge du format de tables ouvert Apache Iceberg, ont (re) présenté des solutions de migration et d’ingestion de données vers leur plateforme respective et ont lancé une base de données managée basée sur PostgreSQL. Leur objectif ? Couvrir les besoins opérationnels en proposant une solution translytique (aussi appelée HTAP pour « Hybrid transactional/analytical processing »). C’est le créneau historique de SingleStore.
Ingérer plus de données, dont les tables Iceberg
SingleStore, lui, a dévoilé Flow. Issue de l’acquisition de Bryteflow en 2024, cette solution vise à accélérer les migrations de données depuis Snowflake, PostgreSQL, SQL Server, Oracle, Oracle RAC et MySQL vers sa DbaaS, Helios. Un connecteur JDBC générique est en test, tandis que la prise en charge de MongoDB est en préversion privée.
Flow n’est pas un simple outil d’ingestion, il est aussi doté d’un mécanisme de change data capture. Son fonctionnement s’articule autour de deux composants principaux. SingleStore Ingest permet de transférer le schéma, les tables elles-mêmes tant qu’elles ne dépassent pas 10 Go, et assure les opérations CDC entre Helios et le SGBD source. SingleStore XL Ingest gère le transfert de très grandes tables « en les découpant dans de plus petites partitions logiques ». Ces partitions sont copiées en parallèle vers la cible.
L’année dernière, l’ex-MemSQL avait aussi présenté l’intégration « bidirectionnelle » d’Apache Iceberg au sein de son écosystème. Il avait promis des performances égales à celle de son format propriétaire. Ce 17 juin, il a évoqué la préversion d’Iceberg Ingest. Cette fonctionnalité doit permettre d’ingérer directement des tables Iceberg « sans recourir à un outil ETL externe ».
Pour l’instant, elle est compatible avec les tables Iceberg V1 et V2 encapsulant des fichiers Parquet et stockées dans Amazon S3. La prise en charge des catalogues de métadonnées est toutefois assez large : Amazon Glue, Snowflake, l’API REST Catalog d’Iceberg, Hive, ou encore Polaris sont sur la liste.
SingleStore propose trois modes d’ingestion : « one time » pour charger les tables en lots, « append » pour l’ajout de données au fil de l’eau sans suppression et « upsert » pour l’actualisation en continu des données. Une fois le bucket S3 et le metadata catalog connectés, puis le mode d’ingestion choisi, le pipeline détecte les changements et ingère automatiquement les données au sein des tables cibles.
« Personne ne réclame une base de données plus lente… c’est pourquoi nous innovons constamment pour nous assurer que SingleStore reste [rapide], même lorsque les charges de travail deviennent plus complexes et que les volumes de données augmentent », déclare Dave Eyler, vice-président de la gestion des produits de l’entreprise.
Conteneurisation et services FaaS : SingleStore se met sur la voie de Snowflake au nom de l’IA
Après avoir amélioré ses capacités de gestion des vecteurs avec SingleStore 9.0 – essentiels pour les fonctionnalités RAG –, SingleStore entend renforcer Aura Container Service. Cette plateforme de calcul serverless a été pensée pour fournir des conteneurs « préchauffés », afin d’y héberger des applications personnalisées à faible latence. Elle peut maintenant exécuter des fonctions cloud (FaaS) afin de bâtir « des API, des agents IA, des outils pour les agents ou servir des API d’inférence pour les modèles d’embedding ».
En préversion, cette fonctionnalité permet surtout de lancer des requêtes SQL et des scripts Python ou des appels API sans provisionner manuellement les ressources. La prise en charge des GPU dans Aura Container Service est en préversion et ne concerne pour l’instant que de petits processeurs graphiques Nvidia, les vieillissants T4 (architecture Turing, 16 Go de VRAM, 65 TFLOPS en FP16). Sur le papier, Aura Container Service est plus proche de Snowflake Container Services que de Cortex ou MosaicAI de Databricks.
De fait, alors que Snowflake et Databricks s’invitent aux tables des directions métier, SingleStore fournit avant tout des objets pour les administrateurs de DB, les ingénieurs de données et les développeurs.
En ce sens, l’éditeur a introduit en préversion un index multivaleur pour les objets JSON, une « réoptimisation » automatique des requêtes SQL basées sur des statistiques plutôt que des estimations (également disponible dans la version on-premise), ou encore « la ramification et l’attachement de bases de données entre groupes d’espaces de travail ». Cette dernière fonctionnalité, tout comme la récupération « point-in time » et la reprise après désastre « intelligente », est disponible sur AWS et GCP.
Les développeurs, eux, ont le droit à une amélioration de l’assistant IA SQrl, à une intégration avec GitHub, des planifications et du versionnage de Notebooks, une interface utilisateur FinOps revue et corrigée, un éditeur SQL multifenêtre avec autocomplétion et à une vue plus précise des pipelines et des séquences qui les composent.
Selon Kevin Petrie, analyste chez BARC US, le développement de l’IA dépend de la synchronisation des cycles de vie des données, des modèles et des applications. Il souligne donc l’importance d’Aura Container Service et de l’intégration avec GitHub.
« Aura Container Service est une bonne initiative, car il permet de construire et d’enchâsser des flux de travail ou des outils de manière modulaire dans la plateforme SingleStore », anticipe-t-il. « SingleStore a également intérêt à s’intégrer à GitHub et aux notebooks pour aider les développeurs de solutions IA ».
« Les gorilles tels que Google, Oracle et AWS continueront de dominer le marché des bases de données, mais SingleStore s’est taillé une niche différenciée. »
Kevin PetrieAnalyste, BARC US
En ce qui concerne la comparaison des capacités de l’offre de SingleStore avec celles de ses pairs, Kevin Petrie estime que SingleStore se distingue par la nature translytique de sa plateforme, par défaut plus adaptée à l’IA.
« Les gorilles tels que Google, Oracle et AWS continueront de dominer le marché des bases de données, mais SingleStore s’est taillé une niche différenciée », rappelle-t-il.
William McKnight, président de McKnight Consulting group, a souligné l’importance de l’hébergement des fonctions cloud dans Aura Container Service, en plus d’aborder la question des performances à l’échelle.
« SingleStore est […] un éditeur innovant qui fait considérablement avancer le marché de la gestion des données, en particulier dans le domaine du traitement des données en temps réel », loue l’analyste. « Son engagement en faveur de l’amélioration continue et de l’expérience des développeurs renforce encore cette position. Il souhaite ainsi supprimer les limites et les obstacles pour les constructeurs qui déploient l’IA sur leurs données. »
Se tourner progressivement vers les citizen developers et les data analysts
Sur le papier, SingleStore s’avère pourtant en retard face à ses concurrents, Databricks et Snowflake en premier lieu. Il compte se rattraper au cours de l’année 2025. L’objectif de l’éditeur est de rendre l’IA plus accessible, plus puissante et plus intégrée aux données, selon Dave Eyler.
Des fonctionnalités telles que l’interrogation et l’analyse des données en langage naturel et Agent Studio, un environnement pour le développement de l’IA agentique en mode natif sur SingleStore, font partie de cette initiative, liste-t-il.
William McKnight a suggéré que SingleStore pourrait potentiellement mieux servir ses clients et en attirer des nouveaux, en se propageant au-delà de ses racines pour s’aventurer dans d’autres domaines de la gestion des données.
« SingleStore pourrait fournir des outils d’observabilité plus complets, des capacités d’analyse et de visualisation plus avancées et une prise en charge plus étendue des plateformes en cloud », recommande-t-il.
Kevin Petrie, quant à lui, considère que davantage d’intégrations avec des éditeurs d’IA et de machine learning seraient nécessaires. Cela pourrait être un moyen d’améliorer ses facultés de développement et de gestion de l’IA, en particulier à mesure que l’IA agentique évolue.
« Je conseillerais à SingleStore d’élargir son écosystème d’IA en s’associant à des plateformes d’IA/ML telles que Dataiku, ainsi qu’à des partenaires qui déploient des outils et des applications agentiques pour les fonctions d’entreprise », affirme-t-il. Ces trois dernières années, ce n’est pas la stratégie qu’il a poussée. Comme ses concurrents et les fournisseurs cloud, SingleStore a cherché à internaliser un certain nombre de capacités.