Alexander - stock.adobe.com

IA : la CNCF entrevoit une alternative ouverte à CUDA de Nvidia

Les leaders de l’open source soulignent les avancées de projets tels que OpenTelemetry et discutent du rôle de la communauté open source, dans l’élaboration de l’avenir des charges de travail d’intelligence artificielle et dans la promotion de la collaboration mondiale dans un contexte de tensions géopolitiques.

La Cloud Native Computing Foundation (CNCF) anticipe l’émergence « inévitable » d’une alternative open source à la plateforme de calcul parallèle CUDA de Nvidia. Celle-ci est utilisée pour programmer les processeurs graphiques (GPU) du géant fabless. En parallèle, l’industrie cherche à éviter le verrouillage propriétaire des fournisseurs pour les charges de travail d’intelligence artificielle (IA). L’alternative consiste, pour l’heure, à se tourner vers d’autres équipementiers et « cloudistes ».

Lors d’une conférence de presse à la KubeCon + CloudNativeCon China 2025 à Hong Kong la semaine dernière, Chris Aniszczyk, directeur technique de la CNCF, a abordé les préoccupations des entreprises et a souligné le précédent historique de l’open source qui fournit des alternatives standardisées.

« Les gens n’aiment généralement pas dépendre d’un seul fournisseur ou d’une seule entité pour quoi que ce soit », avance Chris Aniszczyk en réponse à une question de Computer Weekly, une publication sœur du MagIT. « L’open source consiste à réunir différentes organisations qui travaillent sur une manière standardisée de faire les choses. Je pense que c’est une chose inévitable ».

Alternative à CUDA : une neutralité nécessaire, selon la CNCF

Tout en reconnaissant qu’il n’existe pas aujourd’hui d’alternative open source à CUDA pour les GPU Nvidia, Chris Aniszczyk est convaincu que la communauté se regroupera autour d’une telle alternative. « Comme nous nous sommes réunis pour travailler sur le calcul avec Kubernetes, nous allons faire de même pour nous assurer que vous pouvez exécuter des charges de travail d’IA sur différents GPU. Cela ne se fait pas du jour au lendemain, et j’espère que vous verrez des projets de la CNCF qui aideront à certains aspects de cela », anticipe-t-il.

« Comme nous nous sommes réunis pour travailler sur le calcul avec Kubernetes, nous allons faire de même pour nous assurer que vous pouvez exécuter des charges de travail d’IA sur différents GPU. »
Chris AniszczykDirecteur technique, CNCF

De fait, il existe plusieurs projets d’interopérabilité afin d’exécuter les charges de travail sur des GPU. C’est le cas des briques OpenCL, SyCL, de la surcouche OneAPI, de Vulkan, d’OpenMP. Pour autant, les GPU Nvidia sont dépendants de CUDA, tout comme les frameworks de calcul IA qui s’exécutent au-dessus. Du côté d’AMD, l’équivalent de CUDA se nomme ROCm, est open source, mais n’a pas été confié à une fondation. Les puces IA d’AWS (Trainium et Inferentia) dépendent d’un SDK propriétaire (Neuron). Google a fait le pari pour ses TPU sur les frameworks open source OpenXLA et JAX, mais conserve le contrôle de ses deux projets à travers le comité de gouvernance TensorFlow (et ce malgré les partenariats avec de nombreux équipementiers et fournisseurs).

Les commentaires de Chris Aniszczyk sont intervenus alors qu’il exposait la vision de la CNCF pour la prochaine décennie. Si les 10 premières années de la CNCF ont été consacrées à la standardisation des charges de travail conteneurisées avec des projets tels que Kubernetes, les 10 prochaines années seront une « poursuite de cet effort, particulièrement axé sur l’IA ».

Il rappelle que les charges de travail d’IA, qui sont principalement intensives en GPU, nécessitent toujours la même infrastructure robuste que l’écosystème cloud-native fournit. « Chaque charge de travail doit être sécurisée, observée et capable d’évoluer », poursuit-il. « Toute cette technologie que nous avons développée à la CNCF s’applique parfaitement aux charges de travail d’IA ». Les dernières mises à jour de Kubernetes ont, par exemple, renforcé la prise en charge des GPU. Cependant, de manière générale, le support de différents modèles et l’optimisation de l’usage des ressources sont encore complexes.

Au cours de la conférence de presse, Chris Aniszczyk a également souligné les avancées significatives au sein du portefeuille de projets de la CNCF. Il a vanté les mérites d’OpenTelemetry, le deuxième plus grand projet du CNCF après Kubernetes. Le projet favorise la standardisation de l’observabilité à travers les métriques, la journalisation, le traçage, et maintenant, les données de profilage.

« Je considère qu’il s’agit d’une percée dans la mesure où chaque fois qu’une grande partie de l’industrie mondiale adopte un certain système de manière standardisée, cela révolutionne vraiment la manière dont la technologie est adoptée », vante-t-il. Il assure que plus de 50 fournisseurs majeurs d’observabilité adhèrent désormais à la spécification d’OpenTelemetry.

Il a également encensé le « travail technique acharné » réalisé sur etcd, le mécanisme de consensus distribué au cœur de Kubernetes. Les efforts de collaboration de Google, Alibaba, Huawei et d’autres ont considérablement amélioré l’évolutivité d’etcd, permettant à Kubernetes de gérer des clusters beaucoup plus importants.

Alors que les mondes du cloud-native et de l’IA continuent de fusionner, la CNCF se penche également sur les complexités de l’octroi de licences pour les modèles d’IA. Jim Zemlin et Chris Aniszczyk ont mis en avant la nouvelle licence Open Model Definition and Weights (OpenMDW) de la Fondation Linux, conçue pour apporter clarté et prévisibilité aux composants de l’IA open source. Le cadre vise à définir les niveaux d’ouverture des différents artefacts d’un modèle d’IA, y compris les données et les poids, qui diffèrent du code source traditionnel. OpenMDW est compatible avec la définition de l’IA open source posée par l’Open Source Initiative.

Tensions géopolitiques : la Linux Foundation veut dissiper les craintes pour l’open source

La conférence de presse a également abordé la récente intention de la Fondation OpenInfra de rejoindre la Fondation Linux, l’organisation mère de la CNCF. Jonathan Bryce, directeur exécutif de la Fondation OpenInfra, rappelle la collaboration technique de longue date entre les communautés OpenStack et Kubernetes. Les deux groupes considèrent cette décision comme une occasion de combiner leurs efforts en matière de sensibilisation mondiale et de développement de la communauté, en particulier sur des marchés tels que la Chine, l’Amérique du Sud et l’Afrique.

En réponse aux tensions géopolitiques entre les États-Unis et la Chine, Jim Zemlin, directeur exécutif de la Fondation Linux, veut rassurer la communauté sur le fait que la collaboration en matière de logiciels libres n’est pas affectée.

« En tant que bien public librement accessible, l’open source est exemptée des règles de contrôle des exportations et c’est pourquoi nous continuons à collaborer et à vouloir continuer à collaborer », affirme-t-il. Il a établi un parallèle avec les premiers jours de la CNCF, lorsque des concurrents féroces comme Amazon, Microsoft et Google collaboraient sur des projets open source. Pour rappel, la Linux Foundation a écarté des mainteneurs russes du kernel Linux en raison de leur affiliation au Kremlin.

« Si la LF offre une grande visibilité aux projets qu’elle soutient, elle est également accusée de jouer le jeu des grandes entreprises technologiques, au détriment de l’esprit communautaire des débuts. »
Alice PannierEx-directrice du programme des géopolitiques de la technologie à l’IFRI

« [“Les Big Techs”] jouent un rôle croissant, car elles sont directement impliquées dans les projets open source et investissent financièrement dans les fondations et les dépôts de code », écrivait Alice Pannier, alors directrice du programme des géopolitiques de la technologie à l’Institut français des relations internationales (Ifri), en 2022. Elle est l’actuelle cheffe de projets cloud, HPC et informatique quantique de la direction générale des entreprises (DGE). « Cela peut avoir des effets potentiellement néfastes sur le modèle open source lui-même, en raison des intérêts commerciaux en jeu et des risques d’accaparement ».

Et Alice Pannier d’ajouter : « l’écosystème mondial de l’open source est aujourd’hui largement structuré autour d’un petit nombre de fondations principalement américaines, dont nous pouvons mentionner les deux principales : la Linux Foundation (LF) et l’Apache Software Foundation ».

« Si la LF offre une grande visibilité aux projets qu’elle soutient, elle est également accusée de jouer le jeu des grandes entreprises technologiques, au détriment de l’esprit communautaire des débuts. Certains la qualifient même de “consortium industriel qui organise des discussions entre [les géants de la Tech]” », poursuit-elle.

Pour approfondir sur Open Source