microworks - Fotolia

Presto se loge dans une fondation open source

Le moteur SQL multi-source évoluera désormais au sein d’une fondation indépendante afin d’en garantir la pérénité et la transparence

par

Jack Vaughan, News and Site Editor
Cyrille Chausson, Rédacteur en Chef

Publié le: 19 févr. 2019

Le moteur de requêtes Presto SQL veut sortir du lot des outils analytiques. Les membres de l'équipe de développement originale du projet ont décidé d’unir leur force avec l’écosytème pour former la Presto Software Foundation. Objectif : garantir une qualité et une extensibilité du logiciel, tout en faisant progresser le moteur de requêtes dans les entreprises.

Né en 2012, cet outil est utilisé chez les grands du secteur, comme Airbnb, Uber, Walmart. Il est également supporté par de nombreux fournisseurs IT, tels qu’AWS (Presto est à la base d’Athena), Google, Microsoft, Qubole, Sunburst Data, Teradata, Varada – pour n’en citer que certains. Cet écosytème grandissant lui a d’ailleurs valu la 41^e place du classement DB-Engines dans la catégorie de base de données relationnelle – celle comprend 136 systèmes. Il ne cesse de progresser.

L’avancée de Presto

Bien qu'il ait connu une hausse au cours des dernières années, Presto est toujours très loin derrière Apache Hive, également développé chez Facebook pour le traitement des requêtes par lots. Cette solution se situe au 10^e rang dans le classement DB-Engines.

En tant qu'outil plus ancien, Apache Hive a une avance sur le moteur Presto SQL. Hortonworks y a notamment consacré beaucoup d'énergie et a contribué à améliorer ses performances. De plus, Apache Hive a été un composant clé dans de nombreuses distributions Hadoop. Parmi les autres moteurs SQL open source, on retrouve Drill, Hawq, Impala et Spark.

Le nombre d'utilisateurs de Presto hors Facebook a augmenté de façon spectaculaire, affirme Martin Traverso, co-créateur du logiciel et co-fondateur de la Presto Software Foundation. «Il existe désormais une forme de dépendance parmi les utilisateurs et une implication dans la réussite du projet. A l'avenir, nous pensons qu'il est important que le projet reste indépendant. » Lyft, Netflix et Twitter sont cités par les utilisateurs de Presto.

Pour garantir des feuilles de route technologiques qui répondent aux besoins de la communauté, de la transparence et la lisibilité, il a été décidé de mettre sur pied une institution à but non lucratif. La fondation a ainsi placé sur sa roadmap la sécurité, le stockage objet dans le cloud, le failover et la restauration et une meilleure prise en charge de l’ETL, a confirmé le responsable.

Des back-ends multiples

Presto a fait beaucoup de progrès depuis ses premiers jours chez Facebook alors qu’il n’était qu’un moteur alternatif de requête ad hoc en batch. Depuis, la technologie supporte plus back-ends.

Ce que rapporte Justin Borgman, Pdg de Starburst Data. Selon lui, les capacités de fédérations de back-ends de Presto - par exemple, la possibilité de joindre les données de logs stockées dans S3 aux données clients stockées dans MySQL - sont un point clé. En dehors de Facebook, les équipes techniques de Starburst représentent le plus grand groupe de committers au projet Presto à ce jour.

« Presto apporte une couche d'abstraction SQL qui permet d'accéder aux données là où elles se trouvent », explique le responsable. Cela est particulièrement utile alors que les architectures de lacs de données, au départ bâtis sur Hadoop, migrent progressivement vers les services de stockage d'objets dans le cloud.

Le PostgreSQL de Big Data ?

Selon lui, le fait d'avoir une fondation - une organisation indépendante des intérêts d’une entreprise - est une étape importante pour favoriser l’adoption du moteur de requêtes. Avec cette approche, Presto SQL pourrait même connaître la même adhésion que les bases de données open source les plus connues. Une façon de devenir en quelque « le PostgreSQL de l’analytique Big Data».

Presto se loge dans une fondation open source

Le moteur SQL multi-source évoluera désormais au sein d’une fondation indépendante afin d’en garantir la pérénité et la transparence

L’avancée de Presto

Des back-ends multiples

Le PostgreSQL de Big Data ?

Pour approfondir sur Base de données

« Nous ne prévoyons pas de bâtir notre propre moteur analytique » (Tristan Handy, dbt Labs)

Virtualisation de données : Denodo en quête de simplification

BPCE enrichit sa plateforme Data avec un moteur MPP

L’essentiel sur Starburst et Trino

L’avancée de Presto

Des back-ends multiples

Le PostgreSQL de Big Data ?

Sur le même sujet

Pour approfondir sur Base de données

« Nous ne prévoyons pas de bâtir notre propre moteur analytique » (Tristan Handy, dbt Labs)

Virtualisation de données : Denodo en quête de simplification

BPCE enrichit sa plateforme Data avec un moteur MPP

L’essentiel sur Starburst et Trino