Ignite 2021 : Microsoft lance lui aussi un service managé pour Cassandra

Microsoft a déployé une série d’améliorations consacrée à ses services de bases de données cloud Azure Cosmos DB, et a présenté Azure Managed Instance pour Apache Cassandra. Le géant du cloud s’investit là sur un marché hautement concurrentiel.

Le 2 mars dernier, Microsoft a lancé une série de nouveaux services Azure Data dans le cadre de la conférence virtuelle Microsoft Ignite 2021.

Parmi les annonces effectuées lors de l’événement Ignite figurait la disponibilité générale d’Azure Synapse Link pour Cosmos DB, qui intègre le service Azure Synapse Analytics à la base de données en cloud Azure Cosmos DB.

Microsoft fournit désormais un support accru pour l’API MongoDB 4.0 dans Azure Cosmos DB, ce qui permet une meilleure compatibilité pour les utilisateurs de la populaire base de données orientée documents.

Des améliorations apportées à Cosmos DB

Sanjeev Mohan, un analyste chez Gartner, estime que le support de Cosmos DB pour l’API 4.0 de MongoDB le rapproche de la compatibilité totale avec le SGBD NoSQL sous licence SSPL. Sanjeev Mohan rappelle que dans le cadre de la mise à jour de Cosmos DB, la base de données obtient de nouvelles capacités transactionnelles multidocuments et des fonctions d’agrégation.

« C’est une bonne nouvelle pour les utilisateurs de Cosmos DB qui est déjà une base de données polyglotte avec une latence de l’ordre de quelques millisecondes et répliquée mondialement, accessible dans toutes les régions de Microsoft Azure », affirme Sanjeev Mohan.

« Nous constatons une demande croissante de l’analytique en quasi-temps réel en provenance de nombreux verticaux, dont les services financiers, le retail et le secteur de la santé. »
Noël YuhannaAnalyste, Forrester

De son côté, l’analyste de Forrester Noël Yuhanna considère la disponibilité générale d’Azure Synapse Link pour Cosmos DB comme une étape importante chez Microsoft, permettant aux organisations d’effectuer des analyses à la vitesse des transactions.

« Nous constatons une demande croissante de l’analytique en quasi-temps réel en provenance de nombreux verticaux, dont les services financiers, le retail et le secteur de la santé. Cependant, la latence dans le mouvement et le traitement des données des systèmes transactionnels ralentit souvent cette initiative », remarque Noël Yuhanna.
« Avec Azure Synapse Link pour Azure CosmosDB, ils [les ingénieurs de Microsoft] rapprochent l’OLTP [traitement des transactions en ligne] et l’OLAP [traitement analytique en ligne], ce qui aidera les organisations à prendre en charge l’analyse en temps réel avec un minimum d’efforts ».

Azure étend son offre SGBD à Apache Cassandra

Microsoft met également les deux pieds dans le marché dédié à Cassandra avec Azure Managed Instance pour Apache Cassandra. Plusieurs éditeurs, dont DataStax et Instaclustr, offrent déjà des services managés pour ce SGBD. Pour rappel, le grand concurrent de Microsoft dans le cloud, AWS a fait de même en décembre 2019.

« D’après nos recherches, nous constatons que l’adoption d’Apache Cassandra a connu une croissance rapide au cours des deux dernières années, principalement en raison de la nécessité de prendre en charge les applications de données distribuées et analytiques entre les pays », commente Noël Yuhanna. « En une dizaine d’années, Cassandra s’est imposée comme l’une des bases de données distribuées les plus importantes. Avec son service sur le cloud Azure, Microsoft aidera les organisations à simplifier les déploiements ».

Sanjeev Mohan estime que la préversion d’Azure Managed Instance pour Apache Cassandra est destinée à migrer le SGBD NoSQL sur site vers le cloud. Cette offre comprend toutes les capacités d’un service managé dont l’approvisionnement, les sauvegardes/backups et les réparations.

« Comme les déploiements d’Apache Cassandra peuvent être complexes, cette solution contribuera à réduire le temps et les efforts nécessaires pour embarquer des applications Cassandra », considère Sanjeev Mohan.

Lors de l’annonce d’AWS en 2019, Donald Feinberg, un autre analyste chez Gartner remarquait cette même complexité à propos de Cassandra. Toutefois, il convient de rappeler la fiche technique de cette offre. Selon la FAQ de Microsoft, c’est une offre standalone assurée par les équipes de Cosmos DB. En revanche, Microsoft n’administre en l’état que les VM nécessaires au déploiement des instances de base de données distribuées.

« Il s’agit d’un portage de Cassandra sur des machines virtuelles que l’on peut mettre à l’échelle vers le haut ou le bas à l’aide d’une commande manuelle. »
Xavier PerretDirecteur Azure Microsoft France

« Il s’agit d’un portage de Cassandra sur des machines virtuelles que l’on peut mettre à l’échelle vers le haut ou le bas à l’aide d’une commande manuelle. Cette approche est différente de celle appliquée pour Cosmos DB qui bénéficie de l’autoscaling et de la réplication automatisée », précise Xavier Perret, directeur Azure Microsoft France, auprès du MagIT.

En clair, ces VM sont générées à la création d’une instance. L’administrateur doit toujours et encore régir un cluster composé de trois nœuds, l’unité de base de Cassandra en plus de sélectionner la mémoire allouée, l’espace disque et la puissance CPU nécessaire. Les options d’élasticité se gèrent manuellement, dans le CLI Azure.

En revanche, Azure Managed Instance pour Apache Cassandra apporte une fonctionnalité intéressante dans un contexte de migration ou de recherche de performances par le débord dans le cloud : il est possible de l’utiliser en mode hybride. Azure ExpressRoute permet d’assurer la connexion entre un réseau privé sur site et le cloud Azure, moyennant un peering privé ou le peering Microsoft via un VLAN. Malheureusement, ce type de services cache en réalité plusieurs méthodes de connexions, soit difficiles à déployer, soit chères, souvent les deux. De plus, cette discussion est généralement tripartite : l’hébergeur/le prestataire, le client et le fournisseur de cloud.

Une demande et une concurrence croissantes

Sanjeev Mohan remarque que l’offre Astra de DataStax est déjà disponible sur Microsoft Azure. Le géant du cloud propose là une alternative. Cependant, l’analyste fait bien de noter que DataStax Astra est multitenant et fonctionne sur d’autres clouds publics (AWS) alors que le nouveau service Azure est monotenant et pour Azure seulement.

D’autant que DataStax vient de passer d’un mode similaire à une approche serverless, et promet de garantir l’autoscaling pour Cassandra, une capacité qui a réclamé des développements spécifiques.

Ed Anuff, chef de produit de DataStax, constate un intérêt fort et croissant pour Cassandra. Compte tenu de la demande pour la base de données open source, DataStax s’attend à voir une variété de services émerger sur le marché.

« Il y avait une demande de nos clients pour une offre de VMs managées sur Cassandra. À ce stade, ce n’est pas une solution concurrente directe de celles de DataStax », reconnaît Xavier Perret. L’approche de Microsoft Azure ressemble davantage à celle d’Instaclustr, constate-t-il.

Steve Francis, directeur des recettes d’Instaclustr, relève lui aussi une demande grimpante pour les services managés réservés à ce SGBD NoSQL. « Le fait qu’un géant de la technologie tel que Microsoft soit présent dans l’écosystème Cassandra est un signe positif pour le projet », déclare-t-il.

« L’engagement accru de Microsoft dans Apache Cassandra est une excellente validation pour le projet et démontre son importance continue, alors que les entreprises de toutes sortes se numérisent de plus en plus », assure Steve Francis. « Apache Cassandra offre une scalabilité et des performances inégalées quand elle est gérée par des mains expertes ».

Pour approfondir sur Base de données

Close