EMC World 2011 : GreenPlum va produire sa propre distribution Hadoop

Cloudera peut commencer à se faire du souci.

Cloudera peut commencer à se faire du souci. La société, qui commercialise sa propre distribution Hadoop, devra bientôt faire face à la concurrence de Greenplum, la division base de données et business Intelligence d'EMC qui a annoncé le lancement prochain de GreenPlum HD sa propre distribution Hadoop pour le 3e trimestre 2011.

EMC, qui a fait un gros pari sur le "Big Data", veut accélérer le développement de GreenPlum et multiplie les investissements autour de la gestion et du traitement des grands jeux de données. Ces investissements se traduisent notamment par la montée en puissance des activités R&D de la firme qui devrait compter près de 600 ingénieurs fin 2011 contre 150 lors du rachat.

GreenPlum, qui dispose déjà de sa propre solution (bâtie autour de PostgreSQL) pour le traitement de données structurées, cherche à mettre un pied dans le traitement des données non structurée avec le lancement de GreenPlum HD. Cette nouvelle distribution Hadoop sera proposée en deux versions. La première, dite Community, s'appuiera sur un code 100% libre, tandis qu'une seconde mouture, dite entreprise, sera proposée en mode hybride. Cette dernière version s'appuiera lourdement sur l'implémentation MapReduce d'une start-up de San Jose, MapR. MapR indique que sa solution est jusqu'à 4 à 5 fois plus rapide que les implémentations libres de MapReduce. Notons que la distribution Hadoop de Greenplum fonctionnera sur tout type de serveur, mais sera aussi optimisée pour tirer parti des appliances de la marque.

Pour approfondir sur Open Source

Close