Cet article fait partie de notre guide: Ces nouveaux moteurs de l’analytique moderne

Cloud Spanner : à son tour, Google fait changer SQL de dimension

En amont de Google I/O, Google a ouvert officiellement son service de base de données SQL massivement distribué Cloud Spanner. Son intérêt : une cohérence forte des données.

Cloud Spanner fait officiellement son arrivée au large catalogue de services de données de Google. Alors que démarre ce jour la conférence Google I/O, la firme de Mountain View a souhaité donner une couleur un peu particulière à ce service de base de données relationnelle hautement distribuées, en le dé-corrélant des nombreuses annonces à venir.

Et pour cause : Cloud Spanner vient quelque peu rebattre les cartes des bases de données relationnelles dans le Cloud. Annoncé en février dernier, Cloud Spanner est en fait – et comme de coutume – un service déjà éprouvé par Google en interne. La base de données motorise par exemple les services Play ou encore son serveur de publicité AdWords. Jusqu’alors en beta, Google l’a désormais considéré comme mûr pour basculer en production.

La force principale de Cloud Spanner est de combiner la cohérence des données, chère aux bases de données relationnelles, au modèle hautement distribué et à la scalabilité horizontale, généralement associés aux bases NoSQL. Google propose ici de distribuer son service à l’échelle mondiale, et sans sacrifier les capacités des bases SQL d’entreprise. En clair, proposer une scalabilité élevée, mais sans faire le compromis de la cohérence.

En fait, Cloud Spanner vient résoudre l’un des problèmes clé des bases SQL : la réplication à très grande échelle. Avec ce service,  « les données restent cohérentes même si de nombreux utilisateurs génèrent des transactions en simultanée, et se connectent à plusieurs datacenters aux deux extrémités de la planète », explique Tony Baer, analyste principal chez Ovum, cité chez nos confrères et partenaires de SearchCloudComputing (groupe TechTarget, propriétaire du MagIT).

Pour cela, Cloud Spanner s’appuie sur la série d’algorithmes Plaxos qui crée alors un consensus entre tous les nœuds distribués. A cela s’ajoute une dimension hardware et logiciel, comme l’explique Dominic Preuss, chef de produit chez Google dans un billet de blog – il parle d’une association horloge atomique et de récepteurs GPS installés sur le réseau Google.

Des partenaires clés

Toutefois pour attirer une clientèle d’entreprises, Google s’est également entouré de partenaires afin de créer une première forme d’écosystème à sa base. La création d’un écosystème autour de ses services Cloud est d’ailleurs un des piliers de la stratégie de conquête des entreprises par le groupe. Mountain View a en effet entrepris de donner davantage de visibilité à ces outils dédiées à cette cible en les dotant d’une entité dédiée, gérée par Diane Greene – une ex de VMware.

Depuis, les offres se sont certes affirmées et multipliées sous cette bannière. Mais Google s’est aussi entouré de partenaires, habitués u monde de l’entreprise, pour s’assurer d’une part de la crédibilité de son offre auprès de cette cible, mais aussi pour s’inscrire dans le prolongement des SI existants. Trifacta, ElasticSearch, RackSpace ou encore SAP – dont le partenariat a été étendu lors de SAPphire qui se tient actuellement à Orlando – forment désormais l’écosystème Google.

Pour Spanner, Google a par exemple choisi Informatica, Alooma ou encore Xplenty. Ils seront les « associés » du groupe en matière d’intégration de données. Informatica, par exemple, propose une offre baptisée Informatica for Google Cloud Platform et permet d’intégrer, ou de migrer, des données dans Big Query par exemple, ou d’autres services de la GCP.

Un marché de la base Cloud qui évolue

Les bases de données distribuées sont devenues une brique clé tant pour les développeurs que pour les fournisseurs Cloud. Les données sont le carburant des applications modernes ; l’IT moderne (IoT, Big Data) favorise leur génération en très grande quantité. Pas question donc de s’en passer : elles représentent aujourd’hui des secteurs très forts d’innovation chez les ténors des bases de données et ceux du Cloud (à l’image d’AWS, de Google et de Microsoft). Les bases NoSQL ont ainsi attiré l’attention sur leurs capacités inhérentes de dimensionnement et de haute disponibilité.

Depuis l’annonce de Spanner en février, des acteurs ont fait leur apparition sur ce segment des bases relationnelles hautement distribuées, avec une cohérence forte des données. Cette semaine, Microsoft a par exemple présenté Cosmo DB, un prolongement de DocumentDB, dopé aux API graphes et clé-valeur, mais avec 5 niveaux ajustables en matière de cohérence de données (la cohérente forte est supportée).

Dans le monde de l’Open Source, Cockroach Labs a présenté ce 10 mai la version 1.0 de sa base de données SQL distribuée, CockroachDB. Cette base propose également de dimensionner SQL massivement, tout en restant ACID. 

Pour approfondir sur Base de données

Close