Cet article fait partie de notre guide: Spark et SQL-On-Hadoop : vers un Hadoop augmenté

HP adapte Vertica aux flux de données en temps réel

La version Excavator de la base de données supporte Kafka. HP promet le support futur de Spark.

HP a profité de sa conférence Big Data qui se tient actuellement à Boston pour déployer un peu plus son arsenal technologique destiné à la gestion des données en volume. A la clé, la présentation Excavator, nouvelle version de la base de données Vertica du groupe, qui se voit taillée pour le traitement des flux de données en temps réel, ainsi que l’avancée du groupe vers le framework Spark, nouvelle idole du monde du Big Data, derrière lequel IBM s’est également récemment rangé.

Il faut dire que le Big Data et l’analyse de données sont deux pivots de la stratégie de HP. D’ailleurs, comme l’a laissé entendre Robert Youngjohns, lors de l’événement, le vice-président de HP Software, la gestion des données en volume ainsi que l’analytique joueront un rôle clé dans HP Entreprise, la future entité née de la scission en deux du groupe mondial – celle-ci étant dédiée au monde professionnel, l’autre, HP Inc, au monde de l’impression et des PC. La stratégie de HP en matière de Big Data est d’être  pragmatique et de rendre l’exploitation des données concrètes, a-t-il également affirmé.

A quelques encablures de la séparation effective des activités (prévue le 1er novembre prochain), HP doit donc agiter fortement les bras pour éviter de voir IBM, par exemple, profiter du flou potentiel qui pourrait entourer l’opération.

Dans le détail, Excavator se voit taillé pour le monde des objets connectés et autres réseaux de capteurs en supportant désormais l’intégration de flux de données en temps réel. Pour cela, explique HP, le groupe a doté sa base du support du framework Open SourceKafka, un système de messaging distribué. Cela doit également simplifier l’intégration de Vertica aux infrastructures modernes, rappelle également HP.

Dans cette même logique, HP a doté sa base d’une fonction « Machine Data Log text Search », qui permet de collecter et d’indexer d’importants de jeux de données générés par les systèmes internes ainsi que le réseau par exemple. HP positionne cette fonction pour identifier les anomalies sur le réseau ou encore les attaques.

Le groupe affirme également avoir collaboré avec HortonWorks, pilier de la communauté Hadoop, autour du développement d’une couche d’abstraction permettant de lancer des requêtes SQL directement sur des fichiers Hadoop de type OCR. Une façon de renforcer l’approche SQL on Hadoop du groupe.

Parmi les autres modifications, HP met également en avant des fonctions analytiques SQL améliorées, une sécurité et une capacité d’administration renforcées.

Avancées vers l’Open Source

Autre point clé de cette conférence, HP a également annoncé son intention de contribuer davantage aux communautés Open Source, qui forment rappelons-le l’une des sources premières des technologies qui rythment le Big Data. Le groupe a décidé de verser dans l’Open Source Vertica Flex Zone table, une technologie apparue avec la version 7 de Vertica, qui évite d’avoir à structurer des schémas de données pour avoir à les manipuler.

Enfin, HP a fait une promesse : celle de travailler au support natif de Spark à Vertica de façon à accélérer le transfert de données entre la base et le framework.

Pour approfondir sur Big Data et Data lake

Close