Getty Images/iStockphoto

Indexima automatise son data hub pour passer au « full SaaS »

Déterminé à accélérer les traitements des données pour les analystes, Indexima compte pour cela passer à une approche « full SaaS » avec laquelle l’automatisation et l’optimisation sont les maîtres mots.

Les interactions entre les outils de self-service BI ou de data visualisation en mode SaaS et les data warehouses comme RedShift, BigQuery, Azure Synapse Analytics ou Snowflake ne sont pas toujours idéales à large échelle.

Indexima veut proposer un « complément naturel » à ces services. L’éditeur développe un moteur de précalcul nommé HyperIndex qui s’appuie sur une montée en mémoire d’index et de préagrégats afin de les interroger plus rapidement et plus simplement. Indexima veut également que les data engineers, les data scientists et les responsables dataops puissent manipuler les données sans optimisation manuelle, grâce à des algorithmes de machine learning qui adaptent les traitements aux requêtes.

Et cet aspect n’a pas échappé à Forrester. Le cabinet de conseils l’a listé parmi le top 5 des acteurs de la data virtualisation réalisant un chiffre d’affaires annuel de moins de 5 millions de dollars, dans une note publiée en juin 2020. Une décision qui a d’abord étonné Emmanuel Dubois, cofondateur et directeur général d’Indexima. En effet, originellement la startup française n’entrait pas dans cette catégorie, il ne s’agissait pas de fermer le capot, mais d’ajouter un turbo aux moteurs de calcul embarqués dans les solutions du marché.

Or, Forrester donne à la data virtualisation, une définition assez large. Parmi les aspects importants de ce concept, la data virtualisation consiste en une couche technique dont résulte l’offuscation de la complexité du traitement de la donnée pour les métiers. C’est aussi une brique intermédiaire entre une source de données (plus précisément un outil qui la contient, un data warehouse ou une base de données) et un outil de traitement analytique. Seulement, cette brique peut avoir diverses fonctions, dont la pseudonymisation, l’accélération des traitements, le chiffrement ou encore leur certification.

Performances avant tout

Indexima a déjà entamé sa mue vers une approche moins technique et cherche à convaincre les data analysts avant tout. « Notre solution permet d’alléger la tâche des data engineers et de permettre aux data analysts de gagner en autonomie », rappelle Emmanuel Dubois.

Si les remarques du cabinet de conseils ont fait réfléchir les responsables pour faire évoluer son offre, Indexima veut d’abord proposer un outil « axé performance ». Originellement, les clients déploient ce Data Hub sur des VM via des distributions Linux. Les utilisateurs qui ont noté le produit sur Peer Review de Gartner en 2020 saluent les performances, mais notent la complexité de déploiement sur site. « Les clients ne veulent plus gérer les installations », confirme le directeur général de la startup. Indexima suit également la tendance du cloud, comme il a suivi l’évolution des outils BI, des data warehouses et des data lakes.

En mars dernier, Indexima présentait One-Click Cloud, une version managée de sa solution sur AWS. Déployer des clusters de ce moteur d’optimisation des calculs analytiques prendrait trois minutes montre en main sur AWS. La startup veut compléter son portfolio en proposant une offre « full SaaS » sur AWS d’ici à la fin de l’année 2020. Il s’agira d’un « Data Hub » complet. Par la suite, elle étendra sa présence sur Google Cloud et Microsoft Azure. Indexima propose déjà OneClick Cloud sur la marketplace de Microsoft Azure depuis le lancement de la version 1.7.10 de son outil, à la fin du mois d’août. Cela entraîne pour l’éditeur un changement de modèle de facturation qui passe d’un prix fixe à une tarification à l’heure et à l’année par nœud.

One-Click Cloud provoque une course à l’automatisation

Avec la version 1.7.10, Indexima a introduit un moyen de se connecter aux tables externes disponibles dans Microsoft SQL Server, Apache Impala, Oracle et Azure Synapse Analytics. Cela doit permettre d’éviter de copier les données et de réduire le volume de requêtes envoyées et donc le temps de traitement. L’éditeur propose également un moyen pour effectuer des sous-requêtes sur ces tables externes. Outre des outils pour simplifier le chargement et l’interrogation des données par les utilisateurs, Indexima a présenté en préversion « Incremental Analyser », une fonctionnalité pour analyser les requêtes avec des algorithmes de machine learning et accélérer leur traitement avec l’HyperIndex. Ce complément à la gestion automatisée des index devrait être en disponibilité générale en 2021.

Par ailleurs, un nouveau paramètre évite de redémarrer un cluster à l’ajout d’un nœud : celui-ci le reconnaît et l’intègre sans intervention manuelle. La startup travaille également à la réduction de l’empreinte mémoire de son outil en commençant par les dictionnaires (les valeurs distinctes contenues dans l’HyperIndex) qui sont maintenant stockés sur disques. La version 1.7.0 introduit une commande SQL pour compresser la taille des tables. Celle-ci consiste à supprimer définitivement les lignes effacées encore en mémoire.

La startup considère qu’elle a encore du pain sur la planche pour proposer une solution totalement adaptée aux environnements cloud et aux équipes moins techniques. Elle veut renforcer l’automatisation des déploiements et des traitements afin de rendre possible sa stratégie full SaaS. Une feuille de route qui promet 18 mois de travail pour l’équipe de développeurs, selon Emmanuel Dubois.

Une activité commerciale recentrée sur l’Europe

Avant la crise sanitaire, Indexima avait prévu d’étendre doucement ses activités vers les États-Unis. « Nous avons été un peu “refroidis” par le confinement. Nous avons préféré nous retrancher sur nos activités locales », explique Emmanuel Dubois. Présent à Big Data Paris 2020, Indexima a pu « confirmer l’attractivité » de son approche auprès des visiteurs et souhaite poursuivre son développement en Europe depuis Paris, tout en restant « prudent ». Indexima prévoit de lever 4 à 5 millions d’euros d’ici au premier trimestre 2021 afin de renforcer son équipe commerciale locale, entre autres.

Les offres managées lui ont permis de faciliter ce travail à distance. Indexima a signé son premier client d’envergure outre-Atlantique : The Weather Company. La filiale d’IBM spécialisée dans les prévisions météo manipule des pétaoctets de données quotidiennement sur AWS et a souhaité constater la pertinence de l’outil d’Indexima à cette échelle.

C’est également le cas pour l’e-commerçant spécialisé dans la vente d’appareils électroniques reconditionnés BackMarket qui utilise la version managée de l’offre et un déploiement plus standard associé à BigQuery afin d’accélérer les traitements vers sa plateforme BI. La Caisse nationale d’assurance vieillesse (CNAV) a elle aussi testé la solution de manière plus traditionnelle.

Pour approfondir sur Outils décisionnels et analytiques

Close