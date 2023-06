MariaDB a récemment dévoilé sa feuille de route pour ses services en cloud. Le porteur d’un projet open source dérivé de MySQL met l’accent sur l’automatisation des déploiements de ses distributions propriétaires au sein de son DBaaS, SkySQL.

Au début de l’année, il a d’abord revu son « Portal » pour s’aligner sur les éditeurs tels que MongoDB, mais également les trois grands fournisseurs cloud. Cette interface Web doit permettre de configurer une instance MariaDB Enterprise, Xpand ou Serverless Analytics, d’effectuer des requêtes et de superviser les bases de données en cloud. Les usagers peuvent ainsi choisir des tailles d’instances, la sécurité, la topologie de réplication et obtenir une estimation des coûts avant le déploiement. Pour les développeurs ne souhaitant pas sortir de leurs environnements, la société new-yorkaise propose un prodiver Terraform et un API REST.

SkySQL est disponible sur AWS et GCP dans un peu plus de 30 régions cloud. « Nous préparons la disponibilité de SkySQL sur Microsoft Azure dans les prochains mois », indique Jags Ramnarayan, Senior Vice President & directeur général SkySQL chez MariaDB, auprès du MagIT.

Un service DBaaS plus proche d’Aiven que d’Aurora Depuis ce portail, MariaDB fournit un ensemble d’indicateurs dédiés au monitoring dont la charge CPU, le nombre de requêtes par seconde, la santé d’un cluster ou encore le coût d’une instance. L’outil permet d’obtenir des données agrégées, mais aussi de vérifier le fonctionnement d’un nœud ainsi que des passerelles MaxScale (le répartiteur de charge de MariaDB). Cette fonction d’observabilité est également compatible avec les instances de MariaDB Enterprise Server déployé sur site. « Il suffit d’installer un agent sécurisé au niveau de votre base de données distante », affirme un porte-parole. Tout comme Oracle, le spécialiste new-yorkais entend se différencier des autres fournisseurs en infusant de l’IA dans son système de monitoring. MariaDB travaille sur un ensemble d’algorithmes capables de détecter des anomalies, comme des pics de consommation CPU ou RAM. D’autres algorithmes sont utilisés pour corréler ces détections afin de constater si oui ou non, elles révèlent un dysfonctionnement plus important. L’éditeur ajoute à cela des capacités d’analytique prédictive dans le but d’estimer quand une instance atteindra un pic de charge susceptible de causer des erreurs ou des pannes. C’est là qu’entrent en scène les API d’OpenAI. MariaDB teste l’utilisation des modèles de génération de textes du créateur de ChatGPT pour expliquer ces métriques, puis suggérer des modifications en couplant les métriques observées avec la documentation rédigée par ses ingénieurs. En ce sens, MariaDB espère que ses clients enclencheront les fonctions d’autoscaling horizontal et vertical du DBaaS. En effet, il a récemment ajouté un lot de règles pour déclencher, à la hausse ou à la baisse, le nombre de nœuds et la taille des instances suivant la charge. De même, l’éditeur a lancé en préversion technique son produit Cloud Backup, qui permet de définir des politiques de rétention, de disponibilité ou encore définir des formats de stockage. Le service est déjà disponible pour les déploiements de MariaDB Enterprise self managed et on premise. L’entreprise met également en avant les capacités de Xpand, son back-end de base de données SQL distribuée, bientôt capable de prendre en charge PostgreSQL, en sus de MariaDB et MySQL. Pour ce faire, elle s’inspire des projets comme ceux de CockroadDB ou de YugabyteDB, mais contrairement à ces derniers ou à Aurora d’AWS, MariaDB entend proposer une extension entièrement compatible avec la licence open source de PostgreSQL. « Surtout, Xpand ne s’appuie pas sur une architecture primaire – réplicas comme celle d’Aurora », déclare Jags Ramnarayan. L’architecture shared-nothing adoptée par l’éditeur assurerait un meilleur niveau de performance en matière de lecture et d’écriture puisque chaque nœud qui stocke et traite un sous-ensemble de données ne partage pas ses ressources. « Cela permet de prendre en charge des centaines de milliers d’utilisateurs concurrents », vante le responsable. PostgreSQL with Xpand est aussi différent de CockroachDB dans le sens où ce dernier s’appuie sur le niveau d’isolation Serializable des transactions SQL. « L’isolation SERIALIZABLE garantit que même si les transactions s’exécutent en parallèle, le résultat est le même que si elles s’étaient exécutées une par une, sans aucune concurrence », décrit CockroachDB dans sa documentation. À l’inverse, MariaDB préfère s’appuyer sur les niveaux Read Commited (lecture uniquement des données validées), ou Repeatable Read (toutes les lectures effectuées pendant une transaction retournent les mêmes résultats). Si le niveau utilisé par Cockroach assure une meilleure cohérence des transactions, il affecte davantage les performances du SGBDR.

MariaDB prend les trains de l’analytique serverless et du géospatial Pour Serverless Analytics, reposant sur Apache Spark SQL, MariaDB ne prend pas les mêmes précautions en matière d’interopérabilité avec les projets open source. « Avec ce service, vous n’avez plus besoin d’extraire les données de MariaDB et de les envoyer vers RedShift ou Snowflake, nous utilisons un moteur Spark optimisé par nos soins pour effectuer les traitements analytiques opérationnels », avance Jags Ramnarayan. Ce service compatible avec Enterprise Server, Xpand et le moteur MariaDB ColumnStore, mais aussi S3 permet d’écrire des jobs SQL compatibles avec les formats de données JSON, CSV, Parquet et AVRO depuis des notebooks Apache Zeppelin. Selon l’éditeur, Serverless Analytics permettrait d’éviter de déployer et maintenir des pipelines ETL. « Ce sont deux moteurs séparés qui effectuent les traitements OLAP (Spark) et OLTP (MariaDB) », explique le responsable. Pour ce faire, l’éditeur s’appuie sur la nature translytique (HTAP) de sa technologie, mais confère à Serverless Analytics ses propres capacités de calcul, facturées à la consommation. L’éditeur n’a toutefois pas détaillé les fondations de l’architecture sous-jacente. Enfin, MariaDB a annoncé la préversion d’une PaaS géospatiale s’appuyant sur la technologie de CubeWerx, une société que l’éditeur a acquise l’année dernière. Dans son idée, MariaDB s’appuie sur les standards OGC (Open Geospatial Consortium) et stocke les vecteurs (points, lignes, polygones) dans son SGBDR, tandis que les rasters (les images satellites et de drones) résident dans un service de stockage objet. Ce n’est pas le fonctionnement de l’extension PostGIS qui permet de stocker et de traiter les différents types de données géospatiales à même PostgreSQL. En revanche, l’éditeur se rapproche de la démarche d’Esri qui, lui aussi, a lancé une PaaS en 2021. « Le traitement des données géospatiales est un problème Big Data », considère Jags Ramnarayan. « Cela devient très coûteux de stocker toutes les données dans un SGBDR et de les traiter à l’échelle ». L’éditeur permet ensuite aux développeurs d’appeler et de combiner les deux types de données via API pour les afficher à travers une interface Web.