sdecoret - stock.adobe.com

RAG : Teradata lance (enfin) Enterprise Vector Store

L’éditeur historique prendra bientôt en charge la recherche vectorielle comme ses concurrents. Il s’attelle cependant à le faire à large échelle, en tentant de compresser les coûts opérationnels.

Teradata a dévoilé lundi Enterprise Vector Store, une fonctionnalité promise de longue date qui permettra aux clients de traiter presque instantanément de grands volumes de vecteurs pour alimenter le développement de l’IA.

Les vecteurs sont des représentations numériques de données attribuées par des algorithmes. Ils constituent un moyen de structurer les données non structurées, telles que le texte, afin de pouvoir les rechercher et les découvrir. En outre, les vecteurs permettent d’effectuer des recherches par similarité, ce qui permet de découvrir de grandes quantités de données connexes.

Étant donné que les outils d’intelligence artificielle générative nécessitent de grands volumes de données de haute qualité pour fournir des résultats précis, la recherche et le stockage vectoriels sont devenus essentiels.

RAG : Teradata a raté les premiers trains

Selon Steven Dickens, PDG et analyste principal d’HyperFrame Research, en ajoutant Enterprise Vector, Teradata répond à un besoin croissant.

« Nous constatons que le besoin d’une base de données vectorielle spécifique diminue », déclare M. Dickens. « Certains éditeurs proposent des bases de données vectorielles autonomes. Ce que fait Teradata supprime largement ce besoin. Pour les entreprises, cela signifie moins de mouvements de données, une meilleure sécurité, des opérations réduites et un coût plus faible ».

Oracle et AWS, entre autres, ont également ajouté des capacités de recherche et de stockage vectorielles à leurs bases de données.

Parmi les autres concurrents de Teradata, Databricks a lancé la recherche et le stockage vectoriels en disponibilité générale au mois de mai 2024. SingleStore l’a fait à la fin de l’année 2023. Aujourd’hui, Teradata suit la tendance, stimulée par l’intérêt grandissant pour l’IA générative, selon Louis Landry, CTO de Teradata.

Pas de fonctionnalités différenciantes, mais une culture de la robustesse

Teradata permet déjà le développement d’applications propulsées par des techniques d’IA, comme le machine learning. L’ajout de fonctionnalités liées à l’IA générative était une étape supplémentaire logique.

« Le marché a commencé à exploser autour de ces produits », constate Louis Landry. « Les vecteurs sont le prochain type de données à prendre en compte dans un paysage de données d’entreprise, et nous voulions en faire partie »

En outre, les retours des utilisateurs ont joué un rôle, a-t-il poursuivi. Le CTO déclare que les clients ont essayé des bases de données spécialisées. Celles-ci n’auraient pas résisté aux exigences de charge de travail des grandes entreprises. Elles auraient donc besoin d’aide.

En octobre 2024, les ingénieurs de Teradata ont présenté les premiers tests d’intégration d’un type de données consacrées à la vectorisation, ainsi que l’ensemble des défis constatés dans la mise en place d’architecture RAG. L’éditeur s’est attelé à tester un système incluant 10 millions de documents et était en train d’extraire des informations d’une base de 100 millions de PDF.

Outre la mise à l’échelle de ces systèmes avec plusieurs dizaines de millions de documents, ils évoquaient la nécessité d’améliorer la prise en charge des vecteurs dans Teradata.

Ainsi, le type de données vectoriel s’appuiera sur des chaînes binaires BYTE ou VARBYTE plutôt qu’un système « colonne par dimension ». Le calcul des distances entre les vecteurs sera effectué à l’aide d’UDF (User Defined Function). Les ingénieurs ont également testé des moyens de paralléliser les traitements pour l’indexation IVF, la compression des dimensions vectorielles, la création d’index en utilisant Apache Parquet, ainsi que l’algorithme DiskANN, imaginé par Microsoft Research. DiskANN sera sans doute privilégié à IVF, même si le premier offre une fonction de recherche en mode « brut force ».

« DiskANN nous permet d’obtenir des performances supérieures tout en consommant moins de mémoire vive », expliquait alors Artur Borycki, ingénieur sénior chez Teradata.

DataStax – en cours d’acquisition par IBM –, Hazelcast ou encore Aerospike ont fait le même choix.

Avec Enterprise Vector Store, Teradata promet que les clients pourront combiner des données structurées et non structurées pour alimenter les pipelines de développement de l’IA tout en tirant parti des fonctionnalités existantes de Teradata, telles que la gouvernance des données.

En outre, Enterprise Vector Store comprend les éléments suivants :

  • Intégration avec la plateforme Nvidia NIM et plus particulièrement avec les microservices dédiés au RAG, NeMo Retriever.
  • Gestion de l’ensemble du cycle de vie des données vectorisées, depuis la génération et l’indexation jusqu’à la recherche.
  • Traitement des charges de travail dans l’environnement Teradata existant, dans le cloud, sur site et en mode hybride.
  • Prise en charge de frameworks tels que LangChain.
  • Des fonctionnalités visant à garantir la fiabilité des résultats, tels que le suivi et l’explication des modifications apportées aux données au fil du temps.

Bien qu’aucune de ces fonctionnalités ne différencie l’Enterprise Vector Store de Teradata des capacités fournies par des spécialistes tels que Pinecone et ChromaDB, ou de celles offertes par des éditeurs concurrents, les nouvelles capacités sont tout de même importantes, selon Steven Dickens.

« En supprimant la complexité, on économise de l’argent et du temps et l’on réduit la surface d’attaques. »
Steven DickensPDG et analyste principal, HyperFrame Research

« Les vecteurs sont évidemment importants, mais l’activation de cette fonction dans une plateforme largement répandue supprime la complexité », avance l’analyste. « En supprimant la complexité, on économise de l’argent et du temps et l’on réduit la surface d’attaques », répète-t-il.

Par conséquent, toutes les raisons que les clients de Teradata auraient pu avoir de migrer vers une autre plateforme de données disparaissent, assure-t-il. Teradata a modernisé sa plateforme de gestion de données en cloud en 2022, mais demeure fortement concurrencé par des acteurs comme Databricks et Snowflake.  

Teradata veut faire mûrir la recherche vectorielle

Pour l’heure, Enterprise Vector Store est accessible en préversion privée. Sa disponibilité générale est prévue pour le mois de juillet. Le développement de l’IA continuera à faire partie de la feuille de route produit de Teradata, selon M. Landry. Il s’agit notamment d’aider les clients à créer des applications auxquelles ils peuvent faire confiance.

Artur Borycki évoquait en octobre la possibilité d’intégrer, à l’avenir, la recherche plein texte à l’aide de l’algorithme BM25. Cela permettrait d’offrir un mode de recherche hybride, comme le propose actuellement Elastic.

Teradata s’intéresse également au développement d’embeddings temporels afin de comparer des périodes ou d’obtenir des explications sur l’évolution de documents à travers le temps combiné à un système RAG. « Les modèles GPT n’ont pas la notion du temps. Ils opèrent sur les derniers documents disponibles », déclare Artur Borycki. « Si vous leur posez la question dans le but de savoir comment certains aspects ont évolué à travers le temps, vous obtenez une représentation du texte qui définit un historique, mais il ne peut pas interpréter toutes les informations métiers ». Ce serait par exemple préjudiciable pour une assurance pour suivre la gestion des réclamations.

« Le rôle de Teradata dans tout cela n’est pas nécessairement d’être à la pointe du progrès, mais d’apporter une réelle valeur commerciale à mesure que la technologie mûrit. »
Louis LandryCTO, Teradata

En outre, permettre aux clients d’automatiser les processus commerciaux à l’aide d’agents d’IA fait partie de la feuille de route de Teradata, indique le CTO Louis Landry. « Le rôle de Teradata dans tout cela n’est pas nécessairement d’être à la pointe du progrès, mais d’apporter une réelle valeur commerciale à mesure que la technologie mûrit », souligne-t-il.

Selon Steven Dickens, de nouveaux clients pourraient adhérer à l’offre si Teradata peut améliorer sa communication et travailler de manière plus transparente avec les fournisseurs cloud tels qu’AWS, Google et Microsoft.

« Teradata dispose d’une énorme base installée de noms prestigieux, et s’ils peuvent ajouter des noms à cette base grâce à de nouvelles capacités – peut-être dans le marché intermédiaire des entreprises –, cela alimentera la croissance », assure l’analyste. « Les fonctionnalités modernes sont là et ils ont des modes de déploiement en cloud ».

Steven Dickens suggère que Teradata serait bien avisé de se concentrer sur l’intégration de sa plateforme avec ces fournisseurs cloud ou de se rapprocher de ses pairs, à l’instar du partenariat SAP-Databricks.

« Oui, vous pouvez utiliser VantageCloud [sur plusieurs clouds], mais s’agit-il vraiment d’un service first party ? », avance l’analyste. « La plateforme est assez simple à déployer sur AWS, c’est ce type de flux simple que Teradata doit proposer et améliorer ».

Pour approfondir sur Datawarehouse