agsandrew - Fotolia

DBaaS : InfluxData veut faire de sa base Cloud la référence pour l'IoT

InfluxData, éditeur californien spécialiste des données chronologiques, a annoncé deux partenariats intimement liés. Sa DbaaS rejoint Microsoft Azure et PTC la supporte directement dans sa plateforme IIoT ThingWorx hébergée sur le même cloud.

Après avoir déployé la version entreprise de sa base de données Time Series sur le Cloud AWS, InfluxData s’était aventuré sur Google Cloud. Il y a neuf mois, il annonçait la disponibilité de sa DBaaS InfluxDB Cloud sur AWS, puis sur GCP en février 2020. La semaine dernière, le spécialiste des données chronologiques a annoncé l’ajout d’une troisième corde à son arc avec la disponibilité générale d’InfluxDB Cloud sur Microsoft Azure, un service est en cours de finalisation.

InfluxData adopte la même approche que bon nombre d’éditeurs de base de données open source qui assurent que leurs clients ne veulent plus gérer la haute disponibilité et à l’extensibilité de telles briques logicielles.

« La meilleure manière pour une entreprise de monétiser sa plateforme de base de données est en réalité dans le cloud et de façon native. Les utilisateurs essaient la version open source, mais, souvent, ils se rendent comptent de la complexité induite par sa gestion : ils préfèrent utiliser les produits Cloud sur étagère. Il est donc très important qu'InfluxDB soit disponible chez les principaux fournisseurs de cloud, à savoir AWS, Azure et GCP », affirme Evan Kaplan, PDG d’InfluxDB.

InfluxData veut se concentrer sur les cas d’usage IoT

Cette plateforme serverless, multitenant et élastique s’appuie fortement sur Kubernetes et des API afin de gérer des cas d’usage où la notion de temps réel s’avère cruciale. Dans l’IT, ceux-ci sont bien connus. Avec le temps, les bases de données capables de traiter les séries chronologiques sont devenues indissociables de la surveillance de logs, de métriques et autres traces. Mais ce n’est pas ce que font la majorité des clients d’InfluxData.

« Je dirais qu'environ 40 % de nos clients font du monitoring. Vous savez, l'instrumentation logicielle de l’IT : du réseau au serveur, de la VM au conteneur jusqu'à l'application. Et environ 60 % de nos clients développent des cas d’usage IoT. Des entreprises qui construisent des objets connectés grand public ou des solutions IIoT comme PTC. L'IoT se développe de plus en plus rapidement », détaille Evan Kaplan. Pour information, InfluxData compte environ 700 clients.

Finalement, ce ne serait pas surprenant, même si ces estimations sont sûrement réductrices : InfluxData traite également avec des clients comme Paypal, eBay ou Lego. Néanmoins, le dirigeant considère que les bases de données Time Series remplacent et élargissent les capacités des SGBD historiens utilisés depuis des décennies dans l’industrie. Notons que des deux côtés de cette barrière virtuelle, beaucoup des clients d’InfluxData sont des éditeurs comme IBM, Adobe, Autodesk, Mirantis, Cisco, SAP ou encore PTC.

C’est justement avec le spécialiste de la CAO et du PLM que s’est associé InfluxData. PTC propose la base de données Times Series au sein de sa plateforme IIoT ThingWorx depuis 2018. Cette fois-ci, l’entreprise conduite par Jim Heppelmann supporte elle-même la DbaaS intégrée à ThingWorx Cloud et hébergée sur Microsoft Azure. Les clients n’ont qu’un interlocuteur à l’issue de ce contrat OEM.

« Le support d’InfluxDB sur Azure est important pour nous. PTC est un partenaire stratégique de Microsoft Azure, notamment pour tout ce qui concerne l’IoT », déclare Chris Baldwin Directeur senior de la gestion produit chez PTC.

PTC à la recherche de l’efficacité

Pour PTC, ce partenariat s’inscrit dans l’adaptation de sa plateforme IIoT aux exigences de ses clients d’une part, d’élasticité et de robustesse dans le cloud, d’autre part.

Selon Brian Mullen, Vice-président Business Development chez InfluxData, avant de s’intéresser InfluxDB, PTC utilisait une « technologie autre qu’un SGBD Time Series » pour gérer les données chronologiques. En clair, PTC utilisait une base de données relationnelles (H2) qu’il a tenté d’adapter pour obtenir des capacités similaires à un produit comme InfluxDB. Finalement, PTC s’est rapproché d’InfluxData quand il s’est rendu compte que sa solution ne répondait pas totalement aux besoins de ses clients. Chris Baldwin confirme.

« En fait, nous avons essayé de développer nous-mêmes une solution similaire dans notre produit [ThingWorx] et finalement nous avons constaté qu’elle souffrait de la comparaison avec ce qu’InfluxData peut offrir », déclare-t-il. « Nous recommandons à nos clients qui gèrent des solutions IoT à l’échelle d’utiliser soit InfluxDB open source ou la version managée que nous proposons maintenant ».

ThingWorx supporte différentes bases de données capable de stocker des données chronologiques dont H2 (son data store maison), PostgreSQL, SQL Sever, Azure SQL Server et InfluxDB. La solution peut également se connecter des SGBD historiens ou encore des produits Oracle pour les clients qui le souhaitent. Dans cette liste, seule InfluxDB est spécialisée dans le traitement de ce type d’informations.

« En ce qui concerne les données chronologiques, InfluxDB surpasse toutes les bases de données que nous supportons aujourd’hui », ajoute Ayush Tiwari, Senior IoT Product Manager, chez PTC. « Pour l’injection, nous avons placé un seuil à 200 écritures par seconde. InfluxDB peut supporter plus de 6 milliards d’écritures par jour ».

PTC ajoutera également de nouvelles capacités pour supporter un tel flux de données. Les développeurs se concentrent sur l’amélioration du traitement des données et des requêtes à haute vitesse. Concernant l’analytique, le spécialiste de l’IIoT veut laisser le choix à ses clients entre ses propres outils et ceux proposés par InfluxData.

Pour InfluxData, il s’agit de prouver l’efficacité de son modèle dans le cloud et la pertinence des fonctionnalités comprises dans InfluxDB 2.0 qu’ils proposent maintenant sur Azure. Les deux éditeurs vantent les capacités de rétention et de compression d’InfluxDB. InfluxData a fait sa réputation sur sa volonté de non seulement réduire le volume de données à conserver au vu du nombre d’enregistrements possible, mais aussi de suppressions des informations inutiles. Le stockage et son coût ne seraient pas des freins pour les utilisateurs du produit.

Avec son agent Telegraf, InfluxDB permet d’ingérer les données et métadonnées de plus de 200 outils et service. La DBaaS peut traiter les données d’Azure IoT Hub (le service Pub/Sub de Microsoft), de serveurs Windows, de GitHub, d’Azure Storage Queues (service de file d’attente) et de SQL Server. Pour les autres outils, InfluxDB prend en charge 700 connecteurs FluentD, des connecteurs natifs pour Apache NiFi, OpenHab, et JMeter.

Pour rappel, la base de données Time Series a son propre langage de script et de requête nommé Flux. Il doit permettre en premier d’enrichir les métadonnées en provenance des systèmes IT ou des capteurs IoT. L’éditeur y ajoute un support pour Grafana ainsi qu’une variété de fonctionnalités de data visualization depuis son interface utilisateur.

« Nous portons une attention toute particulière à la manière dont nos clients visualisent leurs données. Nous avons un moteur de tâches qui permet aux gens d'agir sur les données, vous pouvez construire des boucles et des systèmes de contrôle autour des flux. Nous avons la possibilité d'exporter vers et d’importer les données depuis d’autres systèmes. Et puis nous cherchons toujours à améliorer les performances, en particulier dans les environnements cloud », liste Evan Kaplan.

InfluxDB Cloud est donc disponible à partir de la région cloud Microsoft Azure Europe de l’Ouest (Amsterdam) sera accessible le 20 septembre depuis la région Est des Etats-Unis (Blue Ridge, en Virginie). La DbaaS est également accessible depuis deux régions AWS (eu-central-1 et us-west-2) et une région Google Cloud Platform (us-central-1).

Pour approfondir sur Open Source

Close