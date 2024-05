OpenShift AI, lancé lors du Red Hat Summit l’année dernière, a remplacé OpenShift Data Science pour MLOps. Quand la précédente plateforme prenait uniquement en charge le cloud, OpenShiftAI supporte l’infrastructure en périphérie et sur site, ainsi que la gestion d’applications distribuées. Elle servira également de couche de base d’automatisation de l’infrastructure pour le nouveau produit RHEL AI.

Avec la version 2.9 d’OpenShift AI, Red Hat a renforcé les connexions entre les frameworks d’IA générative et les outils de service de grands modèles de langage (LLM), ainsi que le substrat Kubernetes et les outils de développement d’applications qui forment OpenShift AI. Désormais, les clients peuvent gérer l’IA prédictive et l’IA générative ensemble, selon Steven Huels, vice-président et directeur général de l’unité commerciale IA de Red Hat.

« OpenShift Data Science ciblait les charges de travail d’IA prédictive et était un service cloud. Beaucoup de nos clients nous ont dit qu’ils avaient besoin de pouvoir déployer sur site et dans des environnements déconnectés et d’avoir plus de contrôle sur les systèmes eux-mêmes lorsque nous avons lancé OpenShift AI », a déclaré Steven Huels lors d’une conférence de presse le 1er mai. « C’est à ce moment-là que nous sommes entrés dans l’espace de l’IA générative. Ce que nous avons mis en place dans OpenShift Data Science et dans la plateforme centrale [OpenShift AI] a pu être transposé directement pour les charges de travail d’IA générative. »

Les fonctions clés d’OpenShift AI 2.9 Les mises à jour d’OpenShift AI 2.9 comprennent les éléments suivants : La prise en charge de plusieurs serveurs de modèles pour exécuter des apps d’IA générative et d’IA prédictive/machine learning ensemble, dans le même architecture OpenShift AI. Cette fonctionnalité s’appuie sur des mises à jour du package open source de définitions de ressources personnalisées KServe de Knative, Istio et Kubernetes qui prend en charge les charges de travail d’IA conteneurisées. Les nouvelles intégrations pour KServe comprennent la prise en charge de vLLM, une bibliothèque open source pour le déployer des LLM ; Text Generation Inference Server, une fork ouverte de la boîte à outils Hugging Face TGI pour l’inférence LLM dirigée par IBM ; et Caikit, un ensemble d’outils de développement Python.

L’orchestration d’applications d’IA distribuées via l’intégration de KubeRay, un opérateur Kubernetes pour le framework d’application d’IA distribuée open source Ray, et CodeFlare, une pile logicielle spécifique à OpenShift qui gère la mise en file d’attente, les quotas de ressources, la gestion des travaux par lots et la mise à l’échelle des ressources du cluster à la demande pour les applications distribuées. Le logiciel est également compatible avec le système de gestion de l’information de la Commission européenne et avec les modèles de Stability AI.

La prise en charge élargie des outils de développement et de visualisation de modèles d’IA en préversion technique, tels que VS Code, RStudio et Compute Unified Device Architecture de Nvidia. Red Hat prévoit aussi d’intégrer OpenShift AI aux microservices d’inférence NeMo de Nvidia à travers de futures mises à jour de KServe.

La prise en charge d’OpenShift en mode « single node », pour les déploiements en périphérie d’OpenShift AI, là encore en préversion technique.

Une fonction de profils d’accélérateurs dans l’interface de gestion d’OpenShift AI pour configurer les accélérateurs matériels tels que Gaudi 3 d’Intel et Instinct d’AMD. Red Hat s’intégrera également aux GPU Arc d’Intel et ceux d’AMD.

De nouvelles intégrations d’outils partenaires tels qu’un opérateur OpenShift certifié pour l’utilitaire de planification GPU Kubernetes de Run:ai ; la prise en charge des modèles de recherche vectorielle et de transformation Elasticsearch Relevance Engine d’Elastic pour le RAG ; et la prise en charge des modèles de génération d’images Stability AI.