InfluxData veut rendre consommables les données chronologiques

La plateforme s’appuie sur des composants Open Source pour collecter, stocker, analyser des données chronologiques dont les résultats sont injectés dans d’autres applications ou systèmes. Une édition Entreprise y apporte des fonctions de clustering.

Pourvoir actionner les données chronologiques dans un monde de microservices et d’IoT. C’est l’équation que la société InfluxData, basée aujourd’hui à San Francisco, a décidé de résoudre avec sa plateforme entièrement dédiée à la digestion de ces données dites Time Series.

Les données chronologiques correspondent en fait à des informations portant sur des intervalles données sur une période donnée. Elles servent à évaluer une tendance ou des variations, que ce soit de température ou de vitesse, mais également de comportement d’un système ou d’une application. Ces données sont généralement collectées en temps réel, à intervalle régulier. Mais leur collecte peut également  suivre une courbe ascendante, en fonction du scenarii de déploiement.

Ces données chronologique sont ainsi des indicateurs ou métriques, mais aussi des événements, qui, suivent des cycles différents des données classiques, ont des spécificités inhérentes et surtout des exigences en termes de traitement, résume en substance  Evan Kaplan, le CEO d’InfluxData. Par exemple, les données de mesure sont constantes, alors que celles portant sur les événements sont, par définition, ciblées et non constantes.

Mais il existe une constance : le volume que cela génère. Jusqu’alors cela était d’ailleurs pris en compte par certaines bases de données NoSQL, comme par exemple MongoDB, Cassandra ou encore Basho. Ce dernier a adapté d’ailleurs sa base Riak aux spécificités des données chronologiques. D’autres ont également élaboré des projets Open Source comme Apache Graphite ou encore KairosDB (elle-même bâtie sur Cassandra).

Mais pour InfluxData, la collecte et le stockage seuls n’ont que peu d’intérêt. Rendre ces données consommables par d’autres systèmes ou applications a plus de valeur.

Pour Evan Kaplan, les bases de données dédiées aux données chronologiques ont aujourd’hui leur carte à jouer dans un contexte où les développeurs et les architectes – la cible principale d’InfluxData - misent fortement sur les microservices et les conteneurs. « Les conteneurs ajoutent certes de la flexibilité aux applications, mais complexifient les infrastructures », explique-t-il.

Cette évolution vers les microservices qui, justement, segmentent les applications en composants applicatifs, « est important pour InfluxData, car cela avec des micro-segments et ces services, Il existe également un besoin pour plus de contrôle », précise-t-il.

Autre accélérateur de ces données chronologiques, l’Internet des objets et ses réseaux de capteurs qui constituent une source inépuisable de séries temporelles à collecter, traiter, analyser et à injecter dans d’autres applications.

Un socle Open Source

La plateforme d’InfluxData s’adosse ainsi à une base de données InfluxDB (entièrement écrite en Go) qui sert de cœur pour le traitement de ces données chronologiques.  Cette base fait partie d’une suite d’outils Open Source (que la société baptise TICK) qui motorisent la plateforme. Telegraf assure la partie collecte des données issues des applications, des capteurs et autres terminaux ou encore systèmes. Telegraf assure certes la collecte mais transforme également les données dans le format et le modèle d’InfluxDB, explique Paul Dix, le fondateur et le CTO d’InfluxData. Un langage, sous ensemble de SQL, permet d’interroger les données. Paul Dix compare ainsi Telegraf à un accélérateur car la transformation des données demanderait beaucoup de temps, assure-t-il.

A Telegraf, Paul Dix associent un autre projet Open Source nommé Chronograf qui sert à contrôler et visualiser les données et enfin Kapacitor qui permet de monitorer les données chronologiques et de développer des systèmes qui réagissent à ces événements et données. En ce sens, précise le CTO, InfluxData se considère comme un socle ou un framework.

Une édition Entreprise

A ce jour, 37% des cas d’usage se retrouvent dans des scénarri DevOps – dont BNP Paribas - , poursuit Tim Hall, le vice-président Produits d’InfluxData. 29% utilisent la plateforme dans l’IoT, 26% dans l’analytique en temps réel. 8 % ont identifié d’autres cas d’usages.

Si InfluxData mise sur un ADN Open Source symboliser une proximité avec les développeurs – comme a pu le faire MongoDB, résume Paul Dix –, la société a bâti un modèle économique sur une version Premium, qui enrichit la plateforme TICK de module « fermés » dédiés aux environnements professionnels (cloud ou sur site), comme le clustering (haute disponibilité, dimensionnement et sécurité). Une édition d’InFluxData est également accessible dans le Cloud (sur AWS).

Pour approfondir sur Big Data et Data lake

Close