Horizon : Snowflake étoffe sa couche de gouvernance pour l’IA

La gouvernance des données n’est plus une simple case à cocher pour la conformité. Chez Snowflake, elle devient un produit à part entière, propulsée par l’intelligence artificielle. L’éditeur devra maintenant tenir ses nouvelles promesses.

Au Summit 2026, Snowflake a multiplié les annonces visant à automatiser des politiques de gouvernance et de sécurité. L’objectif est double : mieux répondre aux incidents et accompagner le déploiement massif d’agents IA dans les entreprises.

À travers la couche de gouvernance Horizon, de nouvelles politiques de protection permettent de masquer les données au sein des colonnes et des lignes, de classer automatiquement les données sensibles et d’appliquer des contrôles de qualité. En préversion privée, Snowflake s’appuie sur l’API Scan Plan d’Iceberg pour appliquer les mêmes restrictions aux tables externes.

« Les annonces faites lors du Summit 2026 ne portent pas sur les formats de données, mais sur le sens, la confiance, les autorisations, le contexte et la gouvernance », insiste Mickael Ni, analyste chez Constellation Research.

Davantage de protections contre les exfiltrations de données

L’analyste fait entre autres référence aux mécanismes de protection supplémentaires en cours de développement. Les deux les plus intéressants visent à empêcher l’exfiltration de données opérée par des humains ou des agents IA. Le premier introduit de nouvelles politiques de gestion des mouvements de données en préversion privée. Le second, en préversion publique, consiste en un système d’approbation multipartite. En clair, ce sera très compliqué, voire impossible, d’accéder aux données sans la validation d’au moins deux personnes habilitées.

Concernant les audits et l’observabilité, l’éditeur ajoute deux capacités : l’audit des accès par les moteurs tiers et le suivi de la santé des pipelines à travers sa plateforme et celles d’acteurs tiers. Ces fonctionnalités sont encore en préversion privée. L’épisode des vols d’identifiants de Ticketmaster et de Santander en 2024 semble avoir durablement vacciné Snowflake.

IA : des garde-fous présents et futurs

Cette gouvernance « ceinture bretelle » pour les données sera appliquée aux agents IA. Le service Cortex Guardrails dispose en « GA » (« general avalability ») d’un moyen de protection contre les injections de prompt. Les 150 classificateurs de détection des données sensibles s’appliquent également aux résultats produits par les LLM, le tout sous l’égide d’Horizon. Tous les éléments détectés seront audités.

L’éditeur a également annoncé l’acquisition de Natoma, pour un montant non communiqué. Ce rachat ajoute une passerelle capable de découvrir et lister des serveurs MCP vérifiés et customs, de les configurer depuis un seul environnement. Cette même interface permet d’appliquer des politiques de sécurité et de conformité. Natoma promettait des moyens de gérer finement les identités et le contexte accessible par chacun des utilisateurs. Le rachat datant du 27 mai, Snowflake doit encore exposer une feuille de route pertinente. Salesforce dispose déjà d’une MCP Gateway à travers MuleSoft. ServiceNow a aussi sa solution en la matière.

L’IA au service de la gouvernance de l’IA

Et, comme chez Informatica, l’IA assistera à la gouvernance de l’IA et des données. L’éditeur a présenté un concept qu’il appelle « Intent-Driven Governance », à savoir une suite de trois « skills » activables par l’IDE agentique CoCo pour créer des politiques (des règles) de gouvernance : masquage de données, protection des lignes et des colonnes, labélisation des données, sensibles, détection des dérives et production d’alertes à la fois pour le compte du RSSI et du Data Protection Officer.

Cette logique sera appliquée à la mise en qualité des données. Un tableau de bord central devra permettre de suivre les métriques correspondantes. En outre, un agent sera consacré à l’analyse des causes profondes de la qualité des données. Ici, l’éditeur s’appuiera sur ces technologies de data lineage à travers la plateforme (en préversion privée) et au niveau des colonnes. Il s’agira d’automatiser la cohérence des tableaux de bord de référence par rapport aux données présentes dans les entrepôts de données.

Dans les deux cas, les démonstrations sont intéressantes, comme chez Informatica, mais les déploiements renseigneront de l’efficacité de ces outils.

Horizon Context devra, à partir de connecteurs spécifiques, collecter les métadonnées d’actifs à l’intérieur ou à l’extérieur de Snowflake, les enrichir de métadonnées et de documentations générées de manière synthétique pour nourrir les agents IA et les outils CoCo et CoWork. Le tout devrait être automatique.

Cortex Sense, un index de métadonnées, reliées selon la méthodologie des graphes, génère automatiquement une ontologie. Mais il faudra attendre que le produit sorte véritablement des bureaux R&D du groupe américain avant de juger de l’efficacité du système.

« La question qui se pose à plus long terme est de savoir si les capacités de gouvernance de Snowflake sont intégrées à l’architecture […] ou si elles ne constituent qu’une avance temporaire [...] [sur] les concurrents. »
Nick PatienceAnalyste, Futurum Group

À l’ère de l’IA agentique, « nous sommes convaincus que notre plateforme, en tant que source de données fiables, sécurisées et gérées, continuera de jouer un rôle essentiel », résume Sridhar Ramaswamy, CEO de Snowflake. « Et en effet, les possibilités offertes par une telle plateforme vont prendre de l’ampleur et devenir plus simples ».

« La gouvernance est désormais un argument de vente courant chez tous les fournisseurs d’IA d’entreprise, et Snowflake n’est pas la seule plateforme à le mettre en avant », souligne Nick Patience, analyste chez Futurum Group. « La question qui se pose à plus long terme est de savoir si les capacités de gouvernance de Snowflake sont intégrées à l’architecture – et donc véritablement difficiles à reproduire – ou si elles ne constituent qu’une avance temporaire que les hyperscalers et les concurrents finiront par rattraper ».

D’autant que la gouvernance a longtemps été confiée à des outils tiers –, Informatica, Collibra, Alation, par exemple. Certaines entreprises pourraient encore faire confiance aux suites tierces qui de toute manière embarqueront des fonctionnalités similaires.

Néanmoins, selon Nick Patience, chez Snowflake, le discours autour de la gouvernance s’appuie sur des éléments substantiels, pas seulement des effets d’annonce.

Le harnais IA de Snowflake commence à faire ses preuves

Déjà, Horizon est le socle du « harnais » IA constitué par Snowflake. Celui-ci aurait prouvé son efficacité auprès des premiers des grands utilisateurs de CoCo (ex Cortex Code), en complément des vues sémantiques.

« Si je crée un agent Cortex et que je le fais passer par CoCo, je peux lui interdire d’interroger toute donnée qui ne relève pas d’une vue sémantique. »
Matt LuiziV-P de l’analytique, Whoop

« Si je veux demander à Claude Code d’interroger ces données, il se contentera probablement d’aller directement dans la table. Il n’en saura pas beaucoup plus », affirme Matt Luizi, vice-président de l’analytique chez Whoop, un fabricant d’objets connectés. « Mais si je crée un agent Cortex et que je le fais passer par CoCo, je peux lui interdire d’interroger toute donnée qui ne relève pas d’une vue sémantique, car notre équipe de gouvernance a établi que ces vues sémantiques constituent la source de vérité ».

Whoop est un de ces clients qui parie fortement sur Snowflake. Tout comme Synopsys, éditeur de logiciels consacrés aux fabricants de semiconducteurs.  

« Avec les frameworks agentiques en dehors d’une couche de gestion de données, l’on crée quelque chose qui n’est ni partageable ni reproductible et dont le comportement variera énormément », juge Sriram Sitaraman, DSI de Synopsys. « Je pense qu’une plateforme intégrant nativement un framework d’IA et des fonctions de gouvernance telle que Snowflake sera toujours beaucoup plus rapide et plus fiable ».

Quid de la majorité des entreprises dont les données sont fragmentées ou distribuées à travers plusieurs systèmes d’information ? Pour l’heure, Snowflake ne propose pas une réponse ferme. Il faudra mettre à l’épreuve son approche d’absorption des métadonnées.

Pour approfondir sur MDM - Gouvernance - Qualité