
Oracle pare sa base de données pour l’IA agentique
Lors de sa conférence annuelle qu’il faut désormais nommer AI World, le fournisseur cloud a annoncé la disponibilité générale d’Oracle AI Database 26ai. Il commence à y infuser l’IA agentique.
Cette version améliore le sharding, le graphe de propriétés, JSON Dual Relational Duality, la prise en charge d’Apache Kafka, les algorithmes de classification. Elle ajoute des procédures stockées écrites en JavaScript, des microservices associés, l’intégration du pare-feu Oracle dans la base de données (pour éviter les injections SQL) et de l’OAuth2 d’Azure AD. Elle bénéficie de l’intégration de l’algorithme de chiffrement postquantique ML-KEM, tout comme Java. Bref, tout ce que l’on peut attendre d’une mise à jour de la base de données d’Oracle.
Comme ses concurrents, le fournisseur mise sur deux lettres : IA.
Une offre solide pour propulser les systèmes RAG
Si Oracle ajoute les deux lettres partout, ce ne serait pas au nom du pur marketing, assure Larry Ellison, cofondateur et CTO d’Oracle.
« Oracle AI Database 26ai n’est pas appelé AI parce que c’est à la mode, mais parce qu’elle inclut des mécanismes de RAG », affirme-t-il.
« Par ailleurs, nous pouvons vectoriser les données dans Oracle Database, mais nous pouvons également exploiter les vecteurs d’autres bases de données ou en provenance d’autres cloud ».
C’est en effet l’une des améliorations clés de 26ai. Elle marque la disponibilité générale du type de données « vecteur ». La vectorisation des données passe par des modèles d’embedding entraîné par Cohere, OpenAI ou d’autres fournisseurs qui en proposeraient sur Hugging Face au format ONNX.
« Cela dépend beaucoup du type de données que vous allez utiliser et de la manière dont vous comptez les utiliser », déclare Maria Colgan, vice-présidente responsable des produits données critiques et moteurs d’IA chez Oracle. « Chez Oracle, nous prenons en charge tous les modèles d’embedding. Nous pouvons tirer parti et utiliser n’importe lequel d’entre eux dans la base de données ou ingérer des vecteurs qui ont été générés à l’aide de n’importe quel modèle en dehors de la base de données ».
L’éditeur proposera toutefois un modèle par défaut, sans que la responsable puisse encore annoncer lequel.
Oracle a également mis à jour son mécanisme d’indexation. La version 23ai avait introduit un algorithme HNSW, le plus populaire sur le marché. La 26ai est l’occasion pour le fournisseur d’ajouter un algorithme IVF (Inverted File Flat, index de recherche inversée) et de finaliser son mode hybride, qui mélange l’indexation plein texte et vectorielle, à l’aide de vecteurs épars (Splade) et l’algorithme BM25. Bien que moins rapide, ce mode est généralement idéal pour s’assurer de trouver les documents exacts dans lesquels se trouve la réponse d’une requête sur une base de connaissances.
Tout cela lui permet d’indexer des données textuelles, des images, des vidéos, des fichiers audios et de les retrouver. La recherche est habituellement fonction de calcul de distances euclidiennes, cosines ou de « Dot Products ». Pour répondre à certains cas où des entreprises auraient besoin d’inclure des paramètres de calcul de distance spécifique, le fournisseur a ajouté une fonction UDF JavaScript. En clair, Oracle adopte toutes les méthodes populaires en matière de recherche vectorielle.
En outre, l’éditeur optimise son « Smart Scan », afin de paralléliser les traitements au moment de traiter de gros volumes de données vectorisées. Pour cela, il dit exploiter le protocole RDMA, un algorithme dédié et Smart Flash Cache dans les baies Exadata. Comme le nom l’indique, cela permet de mettre les données en cache et de les lire plus rapidement.
Oracle AI Database 26ai infuse des primitifs pour l’IA agentique
Évidemment, Oracle ne s’arrête pas à la recherche vectorielle. Il se lance dans l’IA agentique et Autonomous AI Database est le lieu d’accueil des capacités. En ce sens, le fournisseur a lancé Select AI, à la fois une commande pour le SGBDR et un framework pour créer des agents IA.
« Cela fonctionne avec une instruction SELECT, mais elle n’a pas d’expression de vérification linguistique unique », détaille Juan Loaiza, vice-président exécutif des technologies critiques de base de données chez Oracle. « Vous pouvez la transmettre à la base de données pour savoir combien d’employés n’ont pas soumis leur choix de régime d’avantages sociaux. À partir de cette question en langage naturel, c’est la base de données qui va trouver la réponse et vous la renvoyer », poursuit-il. « Vous pouvez ensuite poser des questions complémentaires, par exemple demander d’afficher le nombre par département, afin qu’elle se souvienne où elle en était et puisse ajouter cette question. Et vous pouvez exécuter cela à partir de n’importe quel outil qui accepte le langage SQL ».
Pour ce faire, Oracle s’appuie sur les API des LLM et les serveurs MCP. Select AI s’appuie sur le pattern ReAct (raisonnement et action). Les modèles de langage peuvent interagir avec les expressions NL2SQL (langage naturel vers SQL), les procédures PL/SQL, et les API REST.
Oracle a mis en place des fonctions pour que le modèle de langage suive un processus de planification, d’appel d’outils et de réflexion afin de s’assurer que ce sont bien les bons outils qui sont utilisés lors de cette phase. Une fois cela fait, l’agent fournit la réponse attendue. Le fournisseur a également mis en place une gestion de la mémoire à long terme, en stockant les sessions, en plus de s’appuyer sur la fenêtre de contexte des LLM.
Le tout peut être appliqué pour l’appel à un seul outil, la création d’un agent ou l’orchestration de plusieurs agents. Par défaut, Select AI peut déjà écrire des requêtes SQL, effectuer une recherche vectorielle, sur le Web et de gérer des notifications dans une boîte mail et dans Slack.
Un serveur MCP Oracle permet à Claude Code, GitHub Copilot, ou d’autres assistants de programmation pour exécuter des requêtes SQL.
Dans la documentation, l’éditeur illustre les cas d’usage de ce framework pour créer des agents pour analyser des contenus présents dans une base de données, les comparer avec des informations sur le Web avant de renvoyer le résultat vers un mail.
C’est le squelette qui servira à proposer Oracle AI Database Private Agent Factory. Il fournira un outil no-code pour concevoir, déployer des LLM et des agents IA dans des conteneurs isolés, dans le cloud ou sur site. L’outil no-code mentionné n’est autre qu’AI Agent Studio pour les applications Fusion, présenté en mars 2025.
« Nous savons que beaucoup de nos clients opèrent dans un secteur réglementé qui les oblige à conserver leurs données sur site, et nous ne voulons pas qu’ils passent à côté de cette opportunité », déclare Maria Colgan.
« Le terme “privé” indique donc clairement que cet outil est destiné aux personnes qui ne sont pas encore prêtes à passer au cloud public ».
Private AI Service AI Containers a été développé pour s’exécuter à partir de CPU, en exécutant les LLM au format ONNX. Il s’agit surtout d’exécuter des petits modèles de langage. Plus tard, il prendra en charge les GPU de Nvidia et les librairies RAG du géant fabless : CAGRA (algorithme d’indexation aNN basé sur un graphe) et cuVS (accélération de la recherche vectorielle par GPU).
À cela s’ajoute l’accès par API aux microservices NeMo Retriever de Nvidia. Il est encore question de pipelines RAG avancés.
Un troisième endroit profitera de fonctions d’IA générative : APEX AI Application Generator. La suite low-code/no-code intégré à Oracle AI Database 26ai devra faciliter le développement d’applications à travers une interface en langage naturel et un langage d’expression adapté. En juin, Oracle avait déjà présenté l’intégration d’OCI Generative AI avec APEX afin de créer des agents IA. Les principaux cas d’usage disponibles concernent la recherche vectorielle, mais il est également possible d’appeler des outils.
Oracle change sa stratégie de mise à jour
La plupart des fonctionnalités agentiques sont encore jeunes. Elles sont incrémentales. Justement, puisque le secteur de l’IA pousse les éditeurs à déployer plus rapidement des fonctionnalités, le passage à 26ai ne doit pas être un frein. Cette version LTS n’est pas un renommage, mais presque. « Dès aujourd’hui, Oracle Database 23ai n’existe plus », affirme Juan Loaiza, vice-président exécutif des technologies critiques de base de données chez Oracle. « Tout passe désormais à 26ai. Et l’adoption est très facile, car il suffit d’appliquer l’ensemble du patch d’octobre de ce mois-ci à votre base de données pour être opérationnel ».
« Nous modifions notre stratégie de mise à jour », confirme Maria Colgan. « Aujourd’hui, passer de la version 19 à la version 23 représente un grand pas en avant. Les utilisateurs effectuent de nombreux tests de régression. Ils s’assurent que tout est stable et fonctionne correctement avant de procéder au déploiement », poursuit-elle. « Le passage de la version 23 à la version 26 se fait en toute transparence. Ils appliquent uniquement le patch. C’est beaucoup plus facile à gérer ».
Oracle prévoit de procéder de cette manière, en poussant des mises à jour incrémentales pour les éditions cloud. « Le code de base restera aussi performant et stable qu’ils peuvent s’y attendre », assure la responsable.
« Les fonctionnalités d’IA s’ajoutent à notre précédente version d’Oracle Database 23ai. En clair, cela ne modifie en rien l’architecture, et 19 c gagne aussi des capacités d’IA », complète Juan Loaiza.
Pour autant, Maria Colgan précise qu’Oracle Database 19c ne prend pas en charge les vecteurs, ce qui limite les fonctionnalités à la manipulation de données structurées.
Oracle AI Database 26ai est disponible sur OCI et Azure, AWS, Google. Elle est également accessible via Cloud@Customer et les appliances sur site.