Google expose BigTable sur son Cloud

Avec Cloud BigTable, Google propose un service NoSQL, compatible Hbase, pour les très importants volumes de données.

En matière de services Cloud dédié au traitement des Big Data, Google s’est décidé de sortir l’artillerie lourde. La firme de Mountain View a annoncé exposer sur le Cloud une de ses fondations techniques, qui sert de socle à Gmail ou Analytics : BigTable. Cette base de données, dite NoSQL, est un composant historique de Google. Si le groupe a soigneusement conservé son code, Google a fait le choix en 2006 d’en décrire les mécanismes de scalabilité et de stockage de très large volume de données. De là sont nées des implémentations Open Source de BigTable, comme Cassandra ou encore le projet HBase de la fondation Apache.

C’est donc ce service qui aujourd’hui débarque sur la Cloud Platform de Google et vient donc compléter les autres services de traitement et gestion des Big Data du groupe. Citons par exemple Big Query (requêtage interactif de Big Data) ou encore Cloud Data Flow.

Mais avec Cloud Big Data, Google se positionne sur le haut du panier des services Cloud de traitement des Big Data. Selon Cory O’Connor, chef de produit chez Google, ce service a la capacité d’ingérer jusqu’à des pétaoctets de données grâce à sa structure en colonne. Dans un billet de blog, il met également en avant les performances de la base capable de non seulement stocker d’importants volumes de données, mais également de proposer une latence très faible dans les opérations de lecture-écriture (même si elles se comptent par millions). Les services Cloud BigTable sont exposés via des API HBase, ce qui en fait une extension vers les systèmes Hadoop. Les données sont également chiffrées au repos et lors d’un transfert. Enfin, elle dispose également de possibilité de réplication de données.

Pourtant, ce n’est pas le premier service NoSQL proposé par Google sur son Cloud. La société avait annoncé un service NoSQL baptisé Cloud Datastore, ajoutant une autre façon de structurer ses données sur Google App Engine, le Paas du groupe. Cloud Datastore supportait également les requêtes SQL, en faisant une extension naturelle chez les développeurs.

Des très gros volumes de données, pas de SQL et des rendus très élevés

Avec Cloud BigTable, Google veut aller plus loin. Ce service est « idéal pour les applications qui nécessitent des rendus et des possibilités de dimensionnement très élevés sur des données non structurées clé / valeur, où  chaque valeur ne dépasse les 10 Mo. Cloud BigTable excelle également sous la forme d’un moteur de stockage pour les opérations MapReduce en mode batch, l’analytique et les applications de machine-learning », explique Google sur son site.

Mais « ce n’est pas la bonne solution pour les petits volumes de données », précise encore le site, fixant le volume plancher à 1 To.  Ni pour les développeurs ayant besoin de SQL. « Si vous avez besoin de stocker des objets très structurés ou si vous devez supporter des transactions ACID et des requêtes de type SQL, considérez davantage Cloud Datastore », recommande Google, qui positionne son offre dans les différents services de bases de données qu’il propose. Ce qui en fait une offre pour les entreprises ayant des besoins importants en termes de capacités et de performances.

Le service est pour le moment disponible en bêta. Il en coutera 0,65$ par nœud et par heure avec un maximum de 3 nœuds. Côté stockage, Google facture 0,17$ par Go et par mois sur un stockage sur SSD. Celui sur disque dur (l’offre n’est pas encore active) sera vendu 0,026 par Go et par mois.

Pour approfondir sur Big Data et Data lake

Close