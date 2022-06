Malgré sa mascotte venue du Nord – un Viking –, Rivery.io est née en Israël en 2017. Dès 2018, la startup a mis les voiles vers New York afin d’y installer son bureau américain. En Europe, elle développe ses activités depuis Londres, et bientôt s’établira en France. La jeune pousse compte 75 collaborateurs.

Rivery doit cette croissance relativement rapide à l’édition d’une solution ELT SaaS, à l’instar de Stitch (rachetée par Talend) et de Fivetran.

« J’en discutais avec des clients : aujourd’hui, les entreprises se concentrent sur la modernisation de l’architecture de traitement de données », affirme Thibaut Ceyrolle, membre du conseil d’administration de Rivery. « La première étape a été d’adopter des data warehouses et des data lake clouds. Maintenant que beaucoup de projets ont migré vers le cloud, ils veulent des solutions agiles pour l’extraction, le chargement et la transformation des données ».

Thibaut Ceyrolle connaît bien ce sujet. Jusqu’en septembre 2021, il était à la tête du développement des activités de Snowflake dans la région EMEA.

« Quand j’étais chez Snowflake, j’observais de loin le marché de l’ETL/ELT. Beaucoup d’acteurs avaient à cœur de changer leur message avec la croissance du cloud, mais peu d’entre eux avaient adopté une architecture cloud native », déclare-t-il. « Rivery n’arrive pas sur le marché avec un nouveau concept, mais apporte un produit “pur cloud”, c’est-à-dire scalable, évolutif, facile à intégrer ».

Ce sont là des arguments maintes fois entendus chez les porte-parole des concurrents. Avec leurs offres SaaS, des éditeurs comme Talend, Fivetran, ou encore Hevo s’adressent, eux aussi, aux lignes de métiers commerciales et marketing chargées de récolter les fruits des données clients. Pourtant, Rivery prétend qu’il peut se distinguer des autres acteurs présents sur le marché.

En ce sens, Thibaut Ceyrolle fait valoir le modèle économique de Rivery. Au lieu de facturer ses usagers au nombre de lignes ingérées dans une table, Rivery établit sa tarification suivant le volume de données extraites, puis transformées depuis un data store. Si le point d’entrée est une API, alors c’est la fréquence de synchronisation qui sert de référence à la monétisation (au besoin, Rivery peut rafraîchir les données toutes les cinq minutes). Un simulateur permet de prévoir les coûts selon les charges de travail et la formule choisie (Starter, Professional et Enterprise).

« Plus il effectue de traitements, plus le client peut prétendre à des remises, mais la tarification demeure transparente », assure le membre du conseil d’administration.

Des kits d’intégration pour les data analysts

Techniquement, Rivery a aussi quelques cordes à son arc. Outre ses 190 connecteurs natifs (JDBC/ODBC, API, webhooks, FTP, etc.), l’éditeur mise sur une orchestration simplifiée des workflows. Ici, les flux des sources aux cibles sont appelés « rivières ».

L’outil permet d’administrer ces pipelines ELT/ETL tout en proposant des kits, c’est-à-dire des templates de flux pour les intégrations et les transformations les plus communes. Ces modèles réutilisables sont accessibles depuis une place de marché. Ils sont développés et certifiés par Rivery et ses partenaires.

« Vous n’êtes pas enfermé avec la solution », avance Taylor McGrath, responsable des solutions clients chez Rivery. « Nous pouvons nous adapter à la plupart des architectures de données ».

En cas de besoin, les kits peuvent être édités à façon, avec des scripts SQL et Python, tandis que les worfklows peuvent être complétés avec d’autres outils de transformation de données. Pour rappel, la notion d’ELT (Extract, Load, Transform) renvoie au fait que le traitement est effectué à la fin du processus, en s’appuyant sur le moteur du magasin de données cible.

« Depuis peu, nous avons une machine virtuelle pour exécuter du code Python. Nous offrons un support intégré pour DataFrame, de sorte qu’il est possible de produire un cadre de données à partir d’un script actuel et insérer directement ce dataframe dans une table d’un entrepôt », précise Taylor McGrath.