GamePixel - stock.adobe.com

BI et IA agentique : ThoughtSpot renforce son Analyst Studio

ThoughtSpot veut s’étendre au-delà de la BI en proposant une « plateforme d’analytique agentique ». En ce sens, il annonce un agent de préparation des données. Les analystes retiennent avant tout les capacités de mise en cache pour aider les utilisateurs à contrôler leurs dépenses.

Implantée à Mountain View en Californie, ThoughtSpot propose depuis 2012 une plateforme analytique mêlant automatisation des visualisations et interrogation en langage naturel. À l’instar de Tableau et Qlik avant elle, l’entreprise élargit désormais son périmètre pour offrir un éventail complet de capacités de traitements de données, d’analytique et d’IA.

Lancée en janvier 2025, Analyst Studio constitue la suite de préparation de données de ThoughtSpot. Les fonctionnalités initiales incluent des connecteurs permettant aux analystes et ingénieurs de fusionner des données issues de sources diverses. L’éditeur propose également un environnement de développement SQL assisté par l’IA, ainsi que des outils de maîtrise des coûts de gestion des données.

La mise à jour d’Analyst Studio, déployée mercredi, promet un agent IA de préparation de données. L’agent devra aider les usagers à réaliser des analyses préparatoires de données (comprendre les distributions), à générer des requêtes (savoir quelle est la manière optimale de joindre des données) ou encore à réparer des schémas. Celui-ci sera disponible plus tard cette année.

D’autres éditeurs, dont Snowflake, Databricks ou Google BigQuery, assurent proposer des fonctionnalités similaires. Qlik et Tableau partagent la même vision. Comme chez ses concurrents, elle reste à peaufiner.

Une meilleure gouvernance de la préparation de données et des tableaux de bord

De manière plus prosaïque, ThoughtSpot introduit une interface de feuille de calcul gouvernée. Elle permet aux utilisateurs familiarisés avec Excel d’effectuer des tâches de préparations de données, sans avoir à quitter Analyst Studio. Et les porte-parole de vanter le fait que ThoughtSpot propose désormais un environnement rassemblant un IDE SQL, les notebooks Python et R ainsi que des feuilles de calcul.

« À mesure que davantage de personnes (et d’agents IA) interrogent les données, les dépenses liées au cloud data warehouse (CDW) peuvent rapidement augmenter. »
Jessica HwangResponsable senior marketing produit, ThoughtSpot

Avec la fonctionnalité Unified Data Mashup, l’éditeur promet aux équipes de données de créer une vision unifiée et fiable de leur organisation en fusionnant des données issues d’entrepôts cloud, d’applications métier et de fichiers comme Google Sheets ou Excel dans l’environnement SQL d’Analyst Studio.

L’éditeur semble réagir aux demandes des clients. La plateforme permet aux usagers finaux de créer leurs propres visualisations de données, ce qui rend la gouvernance plus difficile à grande échelle. Le phénomène est amplifié avec Spotter, l’interface agentique accessible par les métiers. Une solution concurrente de Snowflake Intelligence.

Les analystes du secteur retiennent surtout la disponibilité générale de SpotCache… une couche de mise en cache des tables et des vues matérialisées utilisées dans les tableaux de bord.

« À mesure que davantage de personnes (et d’agents IA) interrogent les données, les dépenses liées au cloud data warehouse (CDW) peuvent rapidement augmenter », justifie Jessica Hwang, responsable senior du marketing produit chez ThoughtSpot, dans un billet de blog. « Les coûts deviennent plus difficiles à prévoir et les équipes finissent par faire des compromis : développer les capacités d’analyse IA ou respecter le budget ».

Là encore, cette déclaration reflète l’usage de plus en plus fréquent de Spotter, qui permet de calculer certains indicateurs. La version 3 de l’interface agentique doit traiter les données structurées et non structurées. Elle ajoute des « skills » analytiques avancées.

SpotCache comble un manque dans les fondations de ThoughtSpot

Sous le capot, ThoughtSpot s’appuie sur des connexions directes aux data warehouses, une optimisation des requêtes et l’indexation des résultats. Historiquement, il fournissait sa propre base de données in-memory, FalconDB. En 2020, il a engagé une refonte de son architecture nommée Embrace, davantage portée sur le recours aux entrepôts de données cloud des clients. Il ne proposait pas jusqu’alors d’espace de cache à proprement parler.

Aux clients d’activer les fonctions de cache de leur data warehouse, des systèmes tiers comme Indexima, d’ajuster la taille de leurs clusters et de faire en sorte de respecter les préceptes de l’architecture médaillon.

Sur G2, les utilisateurs évoquent des problèmes de performance avec de gros jeux de données et les multiples visualisations utilisés lors des phases préparatoires. Et avec cela, une gestion des coûts plus imprévisibles qu’avec Power BI ou Tableau.

SpotCache doit permettre de mettre en cache les données des tableaux de bord et rapports les plus consultés. Ce qui n’est pas incompatible avec l’accès aux données en quasi-temps réel. « Vous pouvez même mélanger les deux dans le même Liveboard. Par exemple, placez un objectif de vente trimestriel alimenté par des données mises en cache à côté d’une vue opérationnelle en direct de vos revenus actuels », explique Jessica Hwang.

« Préparer les données pour l’IA est devenu l’étape cruciale pour que les organisations tirent parti de leurs investissements et les rentabilisent. »
Anjali KumariVice-présidente produit, ThoughtSpot

De plus, il est possible avec Analyst Studio de modéliser et de combiner des données en provenance de Snowflake, Databricks, Google Sheets et Microsoft Excel dans un seul jeu de données mis en cache. En clair, l’éditeur promet également de réduire les dépenses liées au processus de développement.

Depuis son espace de travail, l’analyste peut configurer la fréquence de rafraîchissement des données, à faire valider par l’administrateur de la plateforme. « Les analystes peuvent créer et gérer des snapshots dans le cadre de leur flux de travail analytique », ajoute Jessica Hwang.

« Préparer les données pour l’IA est devenu l’étape cruciale pour que les organisations tirent parti de leurs investissements et les rentabilisent », indique Anjali Kumari, vice-présidente produit de ThoughtSpot. « Nous comprenons les contraintes pesant sur les analystes de données. Ces outils rationalisent leur mission en ciblant leurs préoccupations principales : rapidité, efficacité et coût. »

Le coût de ce service ne dépend pas de l’usage et il n’est pas nécessaire d’acheter Analyst Studio pour accéder à SpotCache. L’accès à la couche de mise en cache peut être vendu séparément. ThoughtSpot préfère proposer une tarification au volume de données.

Les entreprises qui ont souscrit à l’offre Enterprise bénéficient de 10 Go de cache par Org. L’abonnement Pro inclut 5 Go par Org (environnement multitenant). Il est possible d’acheter des capacités supplémentaires au besoin. À partir du 28 février, SpotCache sera soumis à une limite de 100 Go par Org, elle passera à 500 Go par Org et à 25 Go par jeux de données au cours du deuxième semestre 2026.

Dans sa documentation, l’éditeur ne mentionne pas les « sous-jacents » techniques de cette strate de cache. Selon les propos recueillis par SiliconAngle, elle n’est autre que DuckDB, une base de données relationnelle orientée colonnes.

L’éditeur ne précise pas non plus les économies réalisables avec un tel système. Il préfère évoquer cela comme un complément à sa couche sémantique agentique.

« J’apprécie qu’ils s’attaquent au défi de la montée en charge avec une gestion prévisible des coûts », commente Donald Farmer, fondateur et analyste du cabinet TreeHive. « Cet obstacle freine l’adoption depuis longtemps. SpotCache s’impose donc comme la nouveauté la plus précieuse. »

La mise à jour n’est toutefois pas majeure, juge-t-il.

Les enjeux de la BI agentique

Avec Analyst Studio désormais disponible, ThoughtSpot se concentre sur la transformation de sa plateforme en facilitateur d’actions autonomes, indique Anjali Kumari.

L’interface Spotter permet d’accéder à des agents spécialisés pour des tâches comme la création de tableaux de bord et des « analyses profondes ». Avec Spotter comme orchestrateur central, ThoughtSpot ambitionne d’automatiser analyse et préparation de données pour intégrer les indicateurs clés (KPI) dans les flux de travail utilisateurs.

« Nous investissons massivement dans la préparation de données et développons nos capacités sémantiques et de modélisation », assure Anjali Kumari. « Nous nous efforçons de faire en sorte que ces agents opèrent sur des fondations robustes et contextuelles ».

Dans cette expansion, Donald Farmer recommande à ThoughtSpot d’ajouter des capacités de coordination multiagents. Le serveur Model Context Protocol (MCP) de ThoughtSpot permet aux agents d’interagir de façon sécurisée avec les sources de données. Avec la multiplication des déploiements d’agents en entreprise, ces derniers nécessiteront des connexions sécurisées entre eux pour atteindre l’autonomie complète.

« La coordination multiagent évolue d’un agent de préparation isolé vers un “essaim” », décrit Donald Farmer. « Par exemple, un agent de préparation pourrait communiquer automatiquement avec un agent de sécurité pour appliquer les permissions au niveau des lignes durant la transformation ».

« L’intelligence prédictive et prescriptive, qui anticipe les événements et oriente les priorités, représente l’avenir. »
Michael NiAnalyste, Constellation Research

ThoughtSpot pourrait également développer des capacités d’écriture différée et enrichir sa prise en charge naissante des données non structurées. Une intégration native de leur traitement dans Analyst Studio serait la bienvenue.

Michael Ni, analyste chez Constellation Research, suggère quant à lui que ThoughtSpot dépasse la business intelligence descriptive pour intégrer davantage de capacités prédictives et prescriptives.

« La BI descriptive appartient au passé, le diagnostic IA au présent, et l’intelligence prédictive et prescriptive, qui anticipe les événements et oriente les priorités, représente l’avenir », prophétise Michael Ni. « ThoughtSpot excelle dans l’explication du passé et du présent. Son prochain défi consiste à anticiper les impacts et hiérarchiser les enjeux futurs ».

Pour approfondir sur Outils décisionnels et analytiques