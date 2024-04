Le fournisseur a d’abord présenté trois « expériences assistées par l’IA » accessible en préversion, que GCP appelle « Gemini in Databases ». La première est amenée à infuser Database Studio, l’éditeur SQL dans la console de Google Cloud.

Il s’agit d’aider les développeurs « à générer, résumer et corriger du code SQL » pour les bases de données Cloud SQL et AlloyDB.

D’ailleurs, GCP entend offrir par ce moyen une voie de migration pour les clients d’Oracle ou de Microsoft qui utiliseraient Exadata ou SQL Server. À ce titre, AlloyDB Omni serait plus adapté, selon Andi Gutmans. Cette variante d’AlloyDB peut être déployée sur différents clouds et sur site. L’espoir de Google Cloud est d’attirer petit à petit à lui les clients qui n’auraient pas encore adopté le cloud. C’était le premier cas d’usage présenté en août dernier au moment d’intégrer Duet AI dans les offres de bases de données.

Pour l’instant, le gestionnaire de flottes est compatible avec cloud SQL et AlloyDB. « La prise en charge de Cloud Spanner est pour bientôt et l’objectif est de référencer toutes nos bases de données dans ce tableau de bord », avance Andi Gutmans. « Nous avons quelques clients qui l’utilisent déjà. Ils nous ont déjà donné beaucoup de bons retours pour faire évoluer la solution ».

« Nous avons des clients comme Ford qui déploient des milliers de bases de données », avance Andi Gutmans, vice-président et directeur général des bases de données chez Google Cloud. « Les clients ont toujours du mal à s’assurer que tout est sauvegardé, sécurisé. Sous contrôle. C’est pourquoi nous avons créé un seul et unique tableau de bord qui permet de visualiser l’ensemble de vos bases de données ».

Pour les administrateurs de bases de données (DBA) et les opérateurs, Google Cloud a développé un système de gestion de flottes de bases de données propulsées en partie par un LLM (Large Language Model) Gemini. Le système offre une vue unifiée sur la sécurité, la posture de conformité, l’utilisation des bases de données, les erreurs, la gestion des backups, etc.

L’indexation des vecteurs (embeddings) « à la Google »

AlloyDB bénéficie par ailleurs de fonctionnalités afin de mieux prendre en charge des cas d’usage liés à l’IA générative et les architectures RAG (Retrieval Augmented Generation).

En ce sens, GCP a développé ses propres capacités de gestion des vecteurs compatibles avec pgvector, le plugin consacré à cette tâche dans l’écosystème de PostgreSQL, la base de données open source sur lequel s’appuie AlloyDB. GCP a revu le système d’indexation de ce SGBD pour le rendre plus performant que le standard postgres. Le fournisseur assure que les requêtes ciblant des vecteurs sont quatre fois plus rapides, que la création d’index peut être jusqu’à huit fois plus véloce et que son système consomme trois à quatre fois moins de mémoire vive que le « standard PostgreSQL ».

GCP ne s’appuie pas sur la technique de recherche des plus proches voisins (k Nearest Neighbor ou kNN), mais sur un algorithme d’Approximate Nearest Neighbor ou ANN. Moins précise, cette approche est aussi plus efficiente, selon les chercheurs de Google qui travailleraient depuis douze ans sur le sujet.

La recherche approximative du plus proche voisin propulse déjà l’algorithme HSNW (Hierarchical Navigable Small World), celui-là même utilisé pour gérer l’indexation des vecteurs dans pgvector, Redis, ou encore Pinecone. Or, il existe différentes catégories d’algorithmes ANN.

« La plupart des bases de données vectorielles utilisent aujourd’hui HNSW. Ce système d’indexation orienté graphes a ses avantages. Pour autant, les principaux inconvénients de HNSW, dans de nombreux cas d’usage, sont que le temps d’indexation est très lent, que l’utilisation de la mémoire est très élevée. Dans certains cas, les performances peuvent également varier considérablement », liste Andy Gutmans.

Un argumentaire que GCP avait déjà développé en août dernier en présentant son système d’indexation ScANN (Scalable Approximate Nearest Neighbour). En lieu et place de l’approche graphe, ScaNN s’appuie sur une structure en arborescence (B-Tree) vouée à améliorer la compression des vecteurs.

« Les index vectoriels basés sur la quantification arborescente structurent les données de manière que les grappes de vecteurs proches soient regroupées et correctement compressées (quantifiées) », décrit Sandy Ghai, responsable produit groupe, AlloyDB chez Google Cloud, dans un billet de blog.

Non seulement plus frugal, ScANN serait plus adapté aux instructions SIMD prises en charge par les CPU.

« Et ce n’est que le début », affirme Andi Gutmans auprès du MagIT. « Nous connaissons déjà les optimisations que nous pourrons faire au cours des deux ou trois prochains mois. Nous n’avons pas eu le temps de les effectuer avant le début de la conférence [Google Cloud Next’24] ».

À l’avenir, pratiquement toutes les bases de données de Google prendront en charge les vecteurs selon Andi Gutmans, une approche similaire à celle annoncée par AWS en décembre 2023. AlloyDB, Redis, Cloud Spanner, FireStore, MySQL prennent en charge les embeddings ou le feront prochainement.

Toujours pour ancrer les résultats des grands modèles de langage, GCP a rappelé l’intégration avec LangChain, un framework utilisé pour orchestrer les flux des applications d’IA générative.