Cloudera ouvre les voies du multicloud à ses clients

Cloudera a lancé à la fin du mois de septembre sa plateforme Big Data combinant ses technologies et celles d’Hortonworks dans le cloud AWS. Le support du multicloud est d’ores et déjà annoncé.

Cloudera, le pionner du Big Data et d’Hadoop a officiellement lancé la première itération de sa nouvelle Cloudera Data Platform (CDP). La promesse du support du multicloud lui donnera un attrait renouvelé auprès des utilisateurs qui se sont tournés vers AWS et d’autres leaders du cloud pour gérer leurs systèmes Big Data.

Précisons que le multicloud n’est pas encore une réalité chez Cloudera. Pour l’instant, trois services dédiés au data warehouse, au machine learning et l’analytique sont disponibles uniquement sur AWS. L'éditeur prévoit de connecter ses outils à Microsoft Azure plus tard cette année, et en 2020 sur Google Cloud Platform.

Cloudera est le dernier éditeur indépendant sur le marché des plateformes Big Data après sa fusion avec son ancien rival Hortonworks en janvier dernier et le rachat de MapR par HPE en août. Malgré son nom, la société tire toujours 90 % de ses revenus des installations sur site. De fait, elle a été durablement touchée par l’accélération des déploiements Big Data dans le cloud, avec pour conséquence le départ du PDG Tom Reilly et du co-fondateur et stratège en chef Mike Olson. Les faibles résultats du premier trimestre, après l’intégration d’Hortonworks, les ont poussés vers la sortie.

Rivaliser avec les géants du cloud

Selon les analystes ayant participé à un briefing de deux jours à New York la semaine dernière, Cloudera Data Platform devrait donner de meilleurs arguments pour rivaliser avec AWS, Microsoft et Google dans le cloud.

« Ils avancent dans la bonne direction », selon Doug Henschen, analyste chez Constellation Research. En plus des nouveaux services cloud, il relève que CDP prend en charge le stockage objet dans le cloud et qu'il apporte des fonctions administratives et une UX communes au cloud et sur site. Par ailleurs, CDP est capable de répliquer les données, les politiques de gouvernance, et la cartographie (Data Lineage) entre les systèmes, peu importe où ils sont exécutés.

« Cloudera offre une flexibilité et un choix qu’aucun service cloud ne propose actuellement », déclare Doug Henschen.

Le temps révolu d’Hadoop sur CDP

L’éditeur a également réinventé la manière dont il stocke et traite les données, selon William McKnight, président de McKnight Consulting Group. Les clients peuvent toujours utiliser Hadoop Distributed Files System au sein de CDP, mais Cloudera espère que la majorité d’entre eux choisira les options de stockage cloud natif. L’objectif : séparer les ressources de calcul des espaces des entrepôts de données.

Avec ce changement d’orientation, « Pour Cloudera, l’approche de la gestion de données uniquement basée sur HDFS relève du passé », a affirmé William McKnight. L’expert considère que la portabilité de CDP dans le cloud en fera une meilleure alternative pour des utilisateurs cherchant à déployer des applications de machine learning et des services d’analytique avancés à l’échelle d’une entreprise.

L’autre élément clé de cette nouvelle plateforme est le support de l’orchestration de conteneurs Kubernetes. L’engagement de Cloudera envers Kubernetes et les installations hybrides de systèmes cloud et sur site devrait lui permettre de prendre en charge une variété d’options d’infrastructure de cloud computing, selon Lynne Baer, analyste chez Amalgam Insights. CDP offre également aux utilisateurs de Cloudera une approche pragmatique pour développer leurs entrepôts de données et leurs systèmes d’analyse basés sur Hadoop, a-t-elle ajouté.

Cloudera veut éviter la fuite de ses clients

Toujours selon Lynne Baer, la priorité de l'éditeur est de retenir les utilisateurs existants dans son giron. L’analyste assure que Cloudera peut compter sur plus de 900 clients qui génèrent au moins 100 000 dollars en revenus récurrents par an. Ce n’est pas suffisant selon elle : « le véritable défi est d’augmenter le panier moyen au fil du temps plutôt que de gagner de nouveaux clients ». Dans un tweet, Judith Hurwitz, présidente et CEO d’Hurwitz & Associates fait le même constat.

Tony Baer (sans lien avec Lynne Baer), directeur chez dbInsight et actif sur Tweeter, écrit en effet que logiquement les clients de CDP seront ceux « ayant des besoins et des ressources sophistiqués ». Sans surprise, il compare la situation de Cloudera avec celle que vit actuellement Teradata.

Les services Cloudera Data Warehouse, Cloudera Machine Learning et Cloudera Data Hub basés sur CDP sont facturés à l’heure d’utilisation dans le cloud AWS ; le taux horaire varie en fonction de la configuration des instances supportées qu’un client déploie. La version sur site nommée CDP Data Center est disponible en préversion pour des utilisateurs sélectionnés par Cloudera. Elle sera lancée plus tard cette année à partir de 10 000 dollars par nœud et par an.

Pour approfondir sur Big Data et Data lake

Close