IA agentique : Snowflake y va doucement, mais sûrement
Lors de sa conférence annuelle, le spécialiste du data warehousing cloud a principalement mis en avant ses fonctions liées à l’IA générative et agentique. Malgré les questionnements et une forme d’urgence de la part des entreprises, Snowflake conserve son rythme de croisière en annonçant, comme à son habitude, des services en préversion.
En premier lieu, l’éditeur a présenté des fonctionnalités d’IA générative au service de l’analytique.
Il a ainsi dévoilé la préversion publique de Cortex AISQL. Derrière ce nom se cache l’ensemble des fonctions propulsées par des LLM que les data analysts et ingénieurs de données peuvent appeler depuis des requêtes SQL à travers l’interface de Snowflake.
Simplifier l’analyse et la migration de données
« Cela permet de faire des choses comme de l’analyse de sentiments à partir de textes, mais nous pouvons aussi prendre en charge plusieurs formats de données (PDF, fichiers audio, vidéo et des images) », indique Christian Kleinerman, vice-président exécutif produit chez Snowflake, lors d’un point presse.
En l’occurrence, AISQL est une extension de fonctions utilisées pour propulser Document AI, Universal Search et Snowflake Copilot. L’éditeur introduit des « primitives » (des opérateurs SQL) afin de filtrer, joindre, agréger et classer des données non structurées et semi-structurées. D’autres opérateurs permettent de traduire, d’extraire des sentiments, de résumer des documents, d’effectuer un traitement OCR ou encore de comparer la similarité entre des documents suivant la proximité des vecteurs qui les représentent.
Préanalyse de données financières issues de documents publics, détection de tendances dans les commentaires de clients, corrélation de symptômes communs dans des dossiers de patients… Snowflake croit que ces fonctions générales ont un large champ d’application spécifique.
Sous le capot, Snowflake utilise au besoin des modèles d’Anthropic, d’OpenAI, de Meta et de Mistral AI.
Plus spécifiquement pour les ingénieurs de données, Snowflake a présenté SnowConvert AI.
L’éditeur avait déjà rendu SnowConvert disponible depuis au moins le mois de mars 2024.
SnowConvert analyse d’abord le code SQL existant en provenance de Teradata, Oracle, SQL Server, Sybase IQ, RedShift et Azure Synapse afin de le convertir dans le DSL de Snowflake.
SnowConvert peut remanier des tables, des vues, des UDFs, des procédures stockées, des opérations ou encore des objets spécifiques.
L’ajout des deux lettres magiques signifie que Snowflake entend automatiser une plus grande part du processus de migration.
« Cet outil gratuit est accessible par tous nos clients », assure Christian Kleinerman. « Notre objectif est de tirer parti de l’IA elle-même pour simplifier et réduire considérablement les efforts que nécessitent les migrations ».
L’ajout de fonction d’IA doit aider à gérer les erreurs et les éléments non pris en charge par SnowConvert, c’est dire en moyenne 4 % de la base de code.
Outre un assistant à la migration propulsé à l’IA, un outil de vérification de code entre en préversion privée et un outil de validation des données sera prochainement en préversion publique.
« L’une des parties les plus laborieuses d’une migration correspond à la phase de test et de validation du nouveau système afin d’éviter les régressions par rapport au système source », justifie Christian Kleinerman.
Il est déjà prévu d’étendre ce processus à l’écosystème autour des bases de données et des data warehouses, dont les flux ETL et les rapports BI (un très gros travail lors d’un passage d’un entrepôt à un autre).
Snowflake Intelligence, futur remplaçant de Snowflake Copilot
Ensuite, le dirigeant a présenté Snowflake Intelligence, une interface permettant d’interroger des données structurées et non structurées en langage naturel, mais aussi, au besoin d’appeler des outils et des agents IA. Comme avec Genie de Databricks, il est possible de générer des diagrammes, de consulter la requête SQL permettant d’agréger les données et les tables d’où elles proviennent, en sus d’obtenir une explication en langage naturel.
Snowflake Intelligence sera disponible en préversion publique « prochainement ». Pour prendre en charge les outils, l’éditeur prendra en charge les serveurs MCP (Model Context Protocol).
L’éditeur a présenté un agent de son cru consacré à la data science. Bientôt en préversion privée, celui-ci sera capable d’orchestrer des pipelines ML, de générer et d’exécuter du code « fonctionnel » dans des sandbox et utiliser les capacités d’un modèle de raisonnement pour itérer sur la « recette » d’un algorithme de machine learning. Il s’agit d’automatiser l’ensemble du cycle MLOps, de la préparation des données, en passant par le feature engineering, l’entraînement, l’évaluation et le déploiement. Ici, Snowflake marche dans les pas de Google Cloud, mais utilise un modèle de raisonnement hybride d’Anthropic.
Le partage de base de connaissances RAG et de modèles sémantiques, un atout pour Snowflake
Mais les avancées les plus probantes de Snowflake en matière d’IA concernent la contextualisation des LLM et les ajouts faits à sa marketplace.
Bientôt en disponibilité générale, Cortex Knowledge Extensions est un outil permettant à un client de Snowflake de confier depuis la marketplace l’accès à un tiers au service de recherche Cortex (Cortex Search Service), attribué à une table contenant des données textuelles. Les données vectorisées, puis indexées sont accessibles à travers l’API Cortex Search Service, pouvant être intégrées à une application ou à un agent IA. L’accès aux tables contenant les documents peut être monétisé, tandis que les utilisateurs ont accès à une forme de RAG tiers. Une fonctionnalité qui serait déjà testée par les médias américains Associated Press et USA Today, ainsi que StackOverFlow.
« Il s’agit de rendre les données des entreprises plus accessibles aux agents IA et à Snowflake Intelligence. »
Christian KleinermanV-P, exécutif produit, Snowflake
Depuis la marketplace également, il sera possible de partager les modèles sémantiques avec des applications et des agents développés à l’aide de Cortex AI. Ce partage des modèles sémantiques en préversion privée sera également disponible depuis les places de marché internes à Snowflake. Les modèles sémantiques concernent plus spécifiquement des données structurées, tandis que Knowledge Extensions prend en charge les données semi-structurées ou non structurées. « Il s’agit de rendre les données des entreprises plus accessibles aux agents IA et à Snowflake Intelligence », résume Christian Kleinerman.
Il y a près de deux ans, l’éditeur avait présenté les Native Apps, des applications orientées données s’exécutant depuis son architecture et accessibles depuis la marketplace. En préversion privée, il sera bientôt possible de déployer de petites applications composées de modèles sémantiques, de données structurées et non structurées, dont le point de terminaison est une API Cortex Agents. Ces packages applicatifs pourront être monétisés afin qu’un tiers puisse depuis son compte développer des agents IA. Ces paquets pourront eux-mêmes être des agents.
L’IA agentique, une direction plutôt qu’une réalité
Selon Sridhar Ramaswamy, CEO de Snowflake, parmi les 11 580 clients de l’éditeur, environ 5200 utiliseraient déjà les fonctions d’IA et de machine learning disponible depuis sa plateforme.
Le dirigeant n’évoque pas de cas d’usage en production. Il s’est limité à affirmer « qu’un après-midi et quelques centaines de dollars suffisent à tester ce que l’IA peut faire ».
Il faut dire que les fonctionnalités présentées par Snowflake sont pratiquement toutes en préversion. Lors de sa conférence annuelle, l’éditeur présente généralement une feuille de route s’étalant sur un an et demi à deux ans.
À mesure que Snowflake évolue, l’IA agentique jouera un rôle plus important dans ses plans de développement de produits, selon Sridhar Ramaswamy. En outre, l’objectif sous-jacent qui guide les plans de l’éditeur est de fournir les outils nécessaires pour que les données des clients soient prêtes pour l’IA.
« Les entreprises sont paralysées parce que de nombreuses fonctions agentiques des plateformes des éditeurs ne sont pas encore entièrement prises en charge. »
David MenningerDirecteur général et analyste, Ventana Research
« L’IA représente une nouvelle façon d’envisager le fonctionnement des différentes entités au sein d’une entreprise », a-t-il avancé lors de la conférence de presse. « Le rôle de Snowflake est d’être un allié, un agent de transformation pour tous nos clients ».
En aidant ses clients à passer de l’analyse traditionnelle à l’analyse pilotée par l’IA, Snowflake doit se concentrer sur la mise à disposition générale de certaines fonctionnalités clés pour l’instant en préversion, note pour sa part David Menninger, directeur général et analyste chez Ventana Research, une filiale d’ISG. En particulier, Cortex Agents, un service géré conçu pour simplifier le développement des agents IA, pourrait aider les clients de Snowflake.
« L’IA agentique est un sujet d’actualité, mais les entreprises sont paralysées parce que de nombreuses fonctions agentiques des plateformes des éditeurs ne sont pas encore entièrement prises en charge », rappelle-t-il.
Pour approfondir sur IA appliquée, GenAI, IA infusée