agsandrew - Fotolia

Trafodion : un dragon gallois dans les bases translytiques Open Source

Le projet donne des propriétés transactionnelles et surtout ACID à HBase / Hadoop et pousse le framework sur les terres du traitement des workloads hybrides, OLTP et OLAP.

Si les moteurs SQL pour Hadoop ont répondu à une première vague de besoins d’entreprise à se rapprocher de la structure du relationnel, une seconde est actuellement en train d’émerger. Cette seconde vague semble se concrétiser officiellement dans le projet Open Source Trafodion (transactions en gallois). En incubation depuis plus de 2 ans dans le très rigoureux laboratoire de la fondation Apache, Trafodion est devenu ce mois-ci un projet de premier niveau de l’institution Open Source, gagnant ainsi ses lettres de noblesse en matière de gouvernance, mais également en matière de communauté active.

Il faut dire que Trafodion est tout sauf une jeune technologie. Son origine remonte même il y a plus de 20 ans, puis s’est retrouvée chez Compaq avant de toucher terre chez HP qui en a fait une base pour ses usages internes, dopé aux workloads mixtes et hybrides, transactionnelles et analytiques. HP l’a confié à la fondation Apache en 2015 pour la placer à l’Open Source.

Trafodion a la particularité d’augmenter le tandem HBase – HDFS en lui greffant des capacités avancées de structuration des transactions avec SQL, mais aussi en lui apportant ce qui parfois manque dans ces configurations : la cohérence des données. Trafodion, dont le site web assure qu’il est entièrement compatible avec la syntaxe SQL, garantit également des transactions ACID. Le moteur transactionnel de Trafodion pour HBase (SQL-On-Hadoop donc) assure une cohérence complète des données en lecture, explique la FAQ du projet, que ce soit sur des lignes ou colonnes mises à jour.

Vers une explosion des bases translytiques

 Avec son support de Spark, son architecture Hadoop/HDFS/HBase et ses capacités transactionnelles, Trafodion se positionne aujourd’hui sur un segment très en vogue dans le monde de la donnée : celui des bases dites translytiques. Trafodion met logiquement en avant les capacités inhérentes d’Hadoop en matière de scalabilité et de distribution, mais aussi d’économie de coûts.

Ces bases ont en effet la particularité d’associer, au sein d’une unique plateforme, des capacités de traitements de workloads hybrides : transactionnelles, opérationnelles, mais aussi et surtout analytiques, temps réel et streaming – OLTP et OLAP pour résumer. Pour les entreprises, cela constitue une réponse de taille.  Ces bases leur permettent d’utiliser l’ensemble de leurs données à disposition, structurées, non structurées, transactionnelles, analytiques ou pas, et de les digérer dans un socle unique, sans avoir à les déplacer et transformer d’une couche à l’autre.

Ces bases translytiques, hybrides (ce concept a été formalisé par le cabinet d’étude Forrester) sont aujourd’hui devenues un marché sur lequel les gros acteurs des bases de données sont installés, ainsi que d’autres éditeurs plus petits et Open Source. Dans son comptage de fin 2017, Forrester positionnait SAP comme le plus avancé dans ce domaine avec la base In-Memory Hana. Initialement taillée pour les workloads analytiques, l’éditeur allemand avait étendu les usages de Hana au monde transactionnel et à ses applications d’entreprise. Oracle, Redis Labs, IBM et DataStax sont également cités parmi les leaders de ce marché. Microsoft, AeroSpike, VoltDB et MemSQL sont quant à eux partis des acteurs les plus performants (« strong performers »).

Pour approfondir sur Outils décisionnels et analytiques

Close