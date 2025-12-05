S3, le service cloud de stockage en mode objet d’AWS, est désormais capable de contenir des données vectorisées, soit le format dont une IA générative a besoin pour produire des analyses depuis les documents internes d’une entreprise ; une pratique appelée le RAG. Et parce qu’il n’est plus nécessaire de stocker ces vecteurs dans une base de données dédiée, les utilisateurs de services d’IA d’AWS pourraient économiser jusqu’à 90% des coûts de mise en œuvre d’un RAG, dit l’hyperscaler.

« Faire tourner une base de données vectorielle coûte de l’argent. Parce qu’il faut louer un serveur pour exécuter cette base de données 24 heures sur 24 et également louer du stockage rien que pour elle. En passant les vecteurs dans S3, on bascule en mode serverless : le client est simplement facturé que pour le stockage S3 qu’il a déjà, plus uniquement lors des accès aux vecteurs via une API. C’est radicalement moins cher », lance Sébastien Stormacq, porte-parole des développeurs chez AWS.

Cette annonce, faite lors de l’événement AWS Re:Invent 2025 qui se tient cette semaine à Las Vegas, va de pair avec celle d’un nouvel accès S3 pour le service de stockage FSx for OnTap, lequel sert d’extension chez AWS pour les baies NAS de NetApp installées en entreprise. En clair, les clients d’un NAS OnTap qui ont souscrit à ce service chez AWS, sont désormais à quelques clics de souris à peine de pouvoir faire travailler une IA en ligne sur les documents qu’ils produisent sur site.

Un processus en deux temps Attention, le service de stockage S3 ne convertit pas tout seul les documents en vecteurs. « L’utilisateur passe par Bedrock Knowledge Bases, notre service qui permet d’ingérer des documents pour les livrer à des moteurs d’IA. Cela se déroule en deux temps : d’abord on y ingère des documents pour les convertir en vecteurs avec un moteur dédié, ensuite on y ingère les vecteurs pour les utiliser en production avec une IA », résume Sébastien Stormacq, en précisant que Bedrock Knowledge Bases est donc bien un service payable uniquement à l’usage. Il explique de manière très détaillée toute la procédure à suivre dans un billet de blog particulièrement instructif. Il est aussi possible de consulter une documentation pour comprendre comment l’ensemble fonctionne. Le point de départ est que les vecteurs doivent être dans un bucket dédié, du nouveau type S3 Vectors, à créer dans l’espace de stockage S3. On passe ensuite sous Bedrock Knowledge Bases (d’autres interfaces sont possibles, comme la ligne de commande AWS). On y indique comme source un bucket S3 traditionnel (éventuellement lié à un service de stockage NetApp). Il lit tous les fichiers contenus dans ce bucket et les fragmente en chunks. Les chunks sont des morceaux qui paraissent le moins divisibles. Dans un document formaté en HTML, par exemple, il s’agira du texte entre deux balises. Puis, on demande ensuite à un LLM de créer des métadonnées à partir de ces chunks (ses mots-clés, le nom du fichier parent, son emplacement dans le fichier parent...) et d’enregistrer ces métadonnées à des coordonnées qui les situent les unes par rapport aux autres : ce sont les vecteurs.