MapR se vend à HPE : vers l’hiver des pure-players du Big Data

La disparition de MapR, grand pionnier du Big Data, dans HPE pourrait bien être le signe du début de l'extinction des dinosaures d'Hadoop dont Hortonworks et Cloudera.

La fin de MapR semble être un signe annonciateur pour les acteurs qui ont vu le jour, il y a une dizaine d’années, autour d’Hadoop et des technologies de stockage Big Data.

MapR est communément considéré comme le troisième larron d’Hadoop au côté de Cloudera et d’Hortonworks, qui ont récemment fusionné.

L’annonce a été faite ce lundi 5 août. Hewlett Packard Enterprise (HPE) a acquis tous les actifs de MapR pour un montant non précisé. HPE a déclaré qu’il utilisera la technologie de MapR pour sa propre Intelligent Data Platform, qui sert de base à son Intelligence Artificielle (IA) et à ses applications d’apprentissage statistique (Machine Learning).

« La technologie de système de fichiers de MapR va permettre à HPE d’offrir une gamme complète de produits pour gérer les applications d’intelligence artificielle et d’analytique tout en renforçant notre capacité à aider nos clients à gérer leurs données de bout en bout, du Edge au cloud », a déclaré Antonio Neri, président et CEO de HPE.

La particularité de MapR – par rapport aux deux autres principales distributions Hadoop – est qu’il a renoncé au système de fichiers distribués HDFS en faveur de son propre système de fichiers et qu’il possède, plus globalement, une propriété intellectuelle plus développée. MapR n’était en effet pas basée uniquement sur de l’open source, ce qui était – et est toujours – le cas d’Hortonworks et dans une moindre mesure de Cloudera.

Malgré cela, MapR était au bord de la faillite. Dans une lettre aux employés – et un document déposé le 13 mai auprès du Employment Development Department de Californie – l’entreprise faisait savoir qu’elle allait fermer son siège social de Santa Clara et y licencierait 122 employés si les financements nécessaires n’étaient pas rassemblés avant le 14 juin.

MapR s’est finalement dissout dans HPE.

Aller au-delà d’Hadoop

Dans le même temps, l’attelage Cloudera/Hortonworks n’a pas connu une année 2019 facile.

Tom Reilly, PDG de Cloudera, et Mike Olson, co-fondateur et directeur de la stratégie de Cloudera, ont quitté l’entreprise malgré un chiffre d’affaires de 187 millions de dollars au premier trimestre, en légère hausse par rapport aux 182 millions de dollars cumulés réalisés par Cloudera et Hortonworks au même de l’exercice précédent (comme l’avait noté The Registeren juin).

Dans un échange avec les analystes financiers, Tom Reilly admettait même que la fusion avait créé de l’incertitude parmi les clients des deux sociétés.

Stratégies différentes

Dans une interview accordée un peu plus tôt cette année à nos collègues de Computer Weekly (groupe TechTarget, également propriétaire du MagIT), Doug Cutting – directeur de la technologie de Cloudera et co-inventeur d’Hadoop – se disait confiant sur le fait que le nouveau Cloudera finirait par trouver le chemin de la croissance, car – disait-il – la société n’était pas liée à une seule technologie de stockage ou de base de données et n’était donc plus une société purement Hadoop.

Dans ce même entretien, Doug Cutting montrait peu de sympathie pour les éditeurs de bases de données open source qui crient au scandale quand les géants du cloud public – AWS, Google et Microsoft – reprennent leurs fonctionnalités sous forme de services à la demande.

« Si quelque chose est sous licence libre, et que quelqu’un l’utilise sans payer, c’est que les choses fonctionnent comme prévu. Si vous êtes en colère à ce sujet, alors c’est une forme de schizophrénie ».

Sur le déclin apparent d’Hadoop, Doug Cutting constatait que « les gens ont vu que le modèle open source avait du succès et ont construit des choses autour d’Hadoop [même s’il se dirige doucement vers l’obsolescence]. MapReduce est inférieur à Spark, par exemple. HDFS est toujours un excellent système de fichiers, mais avec le passage au cloud – et le provisionnement des clusters à la demande – vous pouvez vouloir de plus en plus utiliser S3 comme stockage. Quant à Yarn, il est beaucoup moins nécessaire quand vous utilisez le cloud public ou privé – parce que vous n’avez plus à partager le temps du cluster, à la place vous provisionnez sur une courte durée des clusters dédiés à des applications, ce qui réduit le besoin d’un ordonnanceur ».

« C’est notre modèle. Nous sommes heureux d’évoluer et d’adopter de nouvelles technologies, parce que les clients ne paient pas pour les technologies elles-mêmes. Il n’est donc pas nécessaire pour nous, en tant que fournisseur, de les garder prisonniers d’une licence ».

Doug Cutting ne citait pas MapR, mais il laissait entendre qu’il était difficile de parler de certaines entreprises en dehors de leurs technologies propres. « Ce sont des entreprises liées à une seule technologie – il est difficile d’imaginer Confluent sans Kafka, ou Databricks sans Spark, etc. Nous, nous essayons de fournir un ensemble d’outils pour résoudre un ensemble spécifique de problèmes, et ces outils vont évoluer », promettait-il.

Est-ce que MapR, en misant sur sa propriété intellectuelle, a tout perdu ? Et est-ce que Cloudera, en misant davantage sur l’open source, aura plus de succès ?

Ou est-ce que tous ces grands noms du Big Data avec leurs distributions Hadoop vont entrer dans une crise de désillusion ? L’avenir le dira rapidement.

Pour approfondir sur Big Data et Data lake

Close