En premier lieu, l’éditeur a présenté des fonctionnalités d’IA générative au service de l’analytique.

Il a ainsi dévoilé la préversion publique de Cortex AISQL. Derrière ce nom se cache l’ensemble des fonctions propulsées par des LLM que les data analysts et ingénieurs de données peuvent appeler depuis des requêtes SQL à travers l’interface de Snowflake.

Il est déjà prévu d’étendre ce processus à l’écosystème autour des bases de données et des data warehouses, dont les flux ETL et les rapports BI (un très gros travail lors d’un passage d’un entrepôt à un autre).

« L’une des parties les plus laborieuses d’une migration correspond à la phase de test et de validation du nouveau système afin d’éviter les régressions par rapport au système source », justifie Christian Kleinerman.

L’ajout de fonction d’IA doit aider à gérer les erreurs et les éléments non pris en charge par SnowConvert, c’est dire en moyenne 4 % de la base de code.

En l’occurrence, AISQL est une extension de fonctions utilisées pour propulser Document AI , Universal Search et Snowflake Copilot. L’éditeur introduit des « primitives » – des opérateurs SQL – afin de filtrer, joindre, agréger et classer des données non structurées et semi-structurées. D’autres opérateurs permettent de traduire, d’extraire des sentiments, de résumer des documents, d’effectuer un traitement OCR ou encore de comparer la similarité entre des documents suivant la proximité des vecteurs qui les représentent.

L’éditeur a présenté un agent de son cru consacré à la data science. Bientôt en préversion privée, celui-ci sera capable d’orchestrer des pipelines ML, de générer et d’exécuter du code « fonctionnel » dans des sandbox et utiliser les capacités d’un modèle de raisonnement pour itérer sur la « recette » d’un algorithme de machine learning. Il s’agit d’automatiser l’ensemble du cycle MLOps, de la préparation des données, en passant par le feature engineering, l’entraînement, l’évaluation et le déploiement. Ici, Snowflake marche dans les pas de Google Cloud , mais utilise un modèle de raisonnement hybride d’Anthropic .

Ensuite, le dirigeant a présenté Snowflake Intelligence, une interface permettant d’interroger des données structurées et non structurées en langage naturel, mais aussi, au besoin d’appeler des outils et des agents IA. Comme avec Genie de Databricks , il est possible de générer des diagrammes, de consulter la requête SQL permettant d’agréger les données et les tables d’où elles proviennent, en sus d’obtenir une explication en langage naturel.

Le partage de base de connaissances RAG et de modèles sémantiques, un atout pour Snowflake

Mais les avancées les plus probantes de Snowflake en matière d’IA concernent la contextualisation des LLM et les ajouts faits à sa marketplace.

Bientôt en disponibilité générale, Cortex Knowledge Extensions est un outil permettant à un client de Snowflake de confier depuis la marketplace l’accès à un tiers au service de recherche Cortex (Cortex Search Service) attribué à une table contenant des données textuelles. Les données vectorisées, puis indexées sont accessibles à travers l’API Cortex Search Service, pouvant être intégrées à une application ou à un agent IA. L’accès aux tables contenant les documents peut être monétisé, tandis que les utilisateurs ont accès à une forme de RAG tiers. Une fonctionnalité qui serait déjà testée par les médias américains Associated Press et USA Today, ainsi que StackOverFlow.

Depuis la marketplace également, il sera possible de partager les modèles sémantiques avec des applications et des agents développés à l’aide de Cortex AI. Ce partage des modèles sémantiques en préversion privée sera également disponible depuis les places de marché internes à Snowflake. Les modèles sémantiques concernent plus spécifiquement des données structurées, tandis que Knowledge Extensions prend en charge les données semi-structurées ou non structurées. « Il s’agit de rendre les données des entreprises plus accessibles aux agents IA et à Snowflake Intelligence », résume Christian Kleinerman.

Il y a près de deux ans, l’éditeur avait présenté les Native Apps, des applications orientées données s’exécutant depuis son architecture et accessibles depuis la marketplace. En préversion privée, il sera bientôt possible de déployer de petites applications composées de modèles sémantiques, de données structurées et non structurées, dont le point de terminaison est une API Cortex Agents. Ces packages applicatifs pourront être monétisés afin qu’un tiers puisse depuis son compte développer des agents IA. Ces paquets pourront eux-mêmes être des agents.