HP inscrit Hadoop dans le prolongement de Vertica

A son tour, HP a décidé de rapprocher le monde transactionnel SQL vers Hadoop.

A son tour, HP a décidé de rapprocher le monde transactionnel SQL vers Hadoop. La semaine dernière, la firme de Meg Whitman a annoncé créer un pont technologique entre sa base de données en colonnes douée de capacités analytiques, HP Vertica, et les principales distributions Hadoop du marché, développées par Hortonworks, MapR et Cloudera. A la clé : HP Vertica for SQL on Hadoop. 

L’idée consiste ainsi à donner la possibilité aux clients de Vertica d’utiliser leurs traditionnelles requêtes SQL pour aller interroger un « data lake » stocké dans un cluster HDFS. Pour au final y opérer, en direct, des analyses et autres traitements analytiques, et ce, encore une fois, via la classique syntaxe SQL.

Interrogé par nos confrères de SearchDatamanagement (groupe TechTarget, propriétaire de LeMagIT.fr), Steve Sarsfield, directeur marketing pour les activités Big Data chez HP, explique clairement que cela permet aux utilisateurs de conserver leurs données dans Hadoop, mais de les interroger via le moteur analytique HP Vertica Enterprise alors intégré en exécutant des requêtes SQL existantes. » Il s’agit ainsi d’inscrire Hadoop dans le prolongement d’une pile classique liée aux données.

« A l’inverse des offres SQL-on-Hadoop concurrentes, les analystes de données peuvent continuer à utiliser leurs outils analytiques et BI qui leur est familier, et auto-générer du code ANSI SQL pour interagir avec une grande variété de distribution Hadoop », ajoute HP dans un communiqué. L’outil supporte les trois distributions pré-citées, la distribution Hadoop communautaire, ou « une combinaison des principales distributions ».

Vertica + IDOL + Hadoop

Cet outil HP a semble-t-il profité de travaux d’ingénierie commun avec Hortonworks, dans lequel HP a investi 50 millions de dollars en juillet dernier. Surtout, cette brique vient un peu plus intégrer les briques de la plate-forme architecturale de HP, Haven. Une plate-forme conceptuelle, associant Vertica, Arcsight et Autonomy, au-dessus des technologies Hadoop, censée illustrer la capacité de HP à répondre à tous les scenarri liés au très tendance phénomène du Big Data. Dans ce cadre, HP avait déjà réalisé des travaux d’intégration en rapprochant IDOL (issu du rachat d’Autonomy) de Vertica, lors de la sortie de IDOL 10.5

HP avait alors cimenté les capacités de découverte, de recherche et d’extraction de données non-structurées d’IDOL à sa base analytique. Cela permet, affirmait HP à l’époque, « d’utiliser SQL sur des données à la fois transactionnelles et non structurées ». Cette v10.5 avait également vu IDOL s’intégrer étroitement à Hadoop. HP Vertica SQL for Hadoop s’inscrit ainsi comme une suite logique.

Evidemment, combiner SQL à Hadoop est une grande tendance des éditeurs spécialistes de la donnée. HP n’est ainsi pas le premier. Notons Teradata avec notamment SQL-H, IBM avec Big SQL ou encore Pivotal (ex-Greenplum) avecHawq. SQL sur Hadoop est très lié  à la difficulté de manipuler MapReduce. Des projets Open Source s’y sont également intéressés, à commencer par Hive et Drill (supporté notamment par MapR). Sans oublier Cloudera avec son vaste projet Impala.

Pour approfondir sur Big Data et Data lake

Close