Cet article fait partie de notre guide: Ces nouveaux moteurs de l’analytique moderne

Big Data Paris : Indexima, qui arrive sur AWS, accélère aussi les requêtes sur S3

Après les données stockées dans HDFS, la société française a adapté sa technologie Data Hub pour requêter directement les données stockées dans S3 - et avec les mêmes gains de performances. Cela marque aussi l'arrivée d'Indexima dans le Cloud.

Une étape de plus dans la progression d’Indexima. Cette jeune société française, qui a construit son modèle économique sur un accélérateur de requêtes sur des données Hadoop, a décidé d’étendre son moteur aux données stockées dans S3, le service de stockage d’AWS. Une avancée clé pour la société qui en prenant place dans la market place d’AWS, s’ouvre non seulement les portes du n°1 de l’IaaS et par extension d’un vaste réseau international, mais se dote également de capacités d’élasticité dont sont aujourd’hui très friandes les entreprises à la recherche de solutions Cloud. 

Il faut dire qu’Indexima a déjà parcouru un long parcours depuis sa génèse chez Mappy et son premier d’usage chez Natixis. Preuve en est, la société disposait d’un stand de bonne taille sur la conférence Big Data Paris, arborant les couleurs de la nouvelle identité visuelle d’Indexima – officielle depuis quelques jours. Selon les dires de son fondateur, Florent Voignier, la société est passée de 3 personnes à 12 aujourd’hui et a recruté un directeur commercial. Ces 6 derniers mois, Indexima a gagné un pipe important de prospects et « des PoC qui sont en cours de signature », ajoute-t-il. Des grands comptes, dans l’Assurance et l’énergie, ont déjà franchi le pas.

C’est aussi le cas de Canal Plus. Le groupe Media a d’ailleurs été moteur dans l’arrivée d’Indexima sur AWS, confirme le responsable. La société avait en effet réalisé un PoC pour Canal avant que celui-ci décide de migrer vers S3. Indexima a donc répondu à la demande, « même si S3 était sur la feuille de route de la société ».

« Beaucoup de projets Hadoop ne passent pas en production. Le Cloud simplifie en partie cela », rappelle-t-il. 

Adapter le moteur Indexima à S3 

Indexima a bâti sa technologie sur un index multi-dimensionnel qui réalise des pré-aggrégats en mémoire pour donner un turbo aux requêtes passées sur des vastes clusters Hadoop. La société revendique des performances largement supérieures à Spark (qui lui-aussi dispose d’une technologie In-Memory). Aujourd’hui, la société a créé une offre nommée Data Hub, qui prend en compte des données stockées aussi bien un cluster Hadoop, on premise ou désormais dans le Cloud sur AWS. 

Pour s’adapter aux services d’AWS, comme S3, des travaux d’ajustements ont été réalisés par Indexima, explique Florent Voignier.  La société a développé un système de fichier (K-store) qui supporte S3 pour que l’ensemble puisse apporter les gains en matière de performances. « Il faut avoir une architecture bien particulière pour avoir de bonnes performances », lance le fondateur qui souligne que la dimension In-Memory propre à Indexima permet notamment d’éviter la latence de S3. Enfin, avec AWS, la solution d’Indexima sépare désormais la couche stockage de données de celle du compute pour assurer l’élasticité promise. « Les données ne sont plus partionnées en fonction du compute ».

Pour autant, il ne faut pas voir en Indexima un concurrent d’Athena, un service d’AWS qui permet aussi de requêter via SQL des fichiers directement stockés dans S3. Selon le responsable, Athena permet certes de requêter des fichiers mais ne propose que peu d’interactions très rapides. Là est alors le terrain de jeu d’Indexima.

Pour approfondir sur Big Data et Data lake

Close