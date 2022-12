Activer la prise en charge des GPUs dans les VMs permet aux applications virtualisées de gérer efficacement les calculs exigeants pour des tâches comme la visualisation de données en temps réel ou même l’accélération graphique des bureaux virtuels. Les hyperviseurs gèrent les GPU soit en mode « pass-through », soit en mode « virtual GPU » (vGPU).

Mais cette prise en charge n'est pas automatique. Elle doit d’abord être manuellement ajoutée aux configurations des VMs. Passons en revue les étapes à suivre pour inclure les GPU dans les hyperviseurs, notamment VMware.

Le mode Pass-through est idéal pour les VMs qui exécutent les applications les plus exigeantes ou les plus gourmandes en ressources graphiques. Il offre les meilleures performances et présente un excellent rapport qualité-prix si de nombreux utilisateurs partagent l’utilisation de cette VM.

Néanmoins, les adaptateurs graphiques modernes prennent souvent en charge plusieurs puces GPU, et chaque puce GPU peut être affectée à un VM différente. Par exemple, la carte Nvidia M6 a un GPU physique, la Nvidia M60 en a deux et la Nvidia M10 en a quatre. Une entreprise peut déployer de nombreux serveurs physiques, chacun équipé d'un adaptateur graphique multi-GPU, afin de fournir un support GPU à de nombreuses VM.

Un mode pass-through permet l'accès, le contrôle et l'utilisation d'un périphérique de manière entière. Lorsqu'un GPU fonctionne en mode pass-through, l'hyperviseur attribue un GPU – l’intégralité de ses cœurs - à une seule VM. La VM a alors une utilisation complète du GPU, de sa puissance de traitement et de sa mémoire graphique. Cette technique est parfois appelée accélération graphique dédiée virtuelle (vDGA). Ici, les autres VMs ne peuvent pas accéder à ce GPU ni en bénéficier.

Comment utiliser vGPU ?

L'autre moyen de virtualiser les GPUs est le mode vGPU. Cette approche permet à plusieurs VMs de partager les ressources du GPU par fraction de temps. Par exemple, si un GPU est virtualisé en 10 vGPUs, et que chaque vGPU est attribué à l'une des 10 VMs, chaque VM aura accès au GPU - et à ses cœurs CUDA - pendant 10 % du temps. Cette technique est parfois appelée accélération graphique partagée virtuelle, ou vSGA.

La relation de base entre le GPU, l'hyperviseur et les VMs est illustrée dans le diagramme ci-dessous.

Hyper-V ne prend pas encore en charge les vGPUs au moment de l’écriture de cet article. Citrix XenServer et VMware ESXi le font. Un pilote graphique dans chaque VM connecte ensuite l’application de la VM au vGPU.

La mémoire graphique n'est pas partageable, chaque VM a accès à une fraction dédiée. Par exemple, si la carte graphique dispose de 32 Go et est répartie entre 10 paires VM-vGPU, chaque vGPU aura accès à 3,2 Go. Ce fonctionnement impose une limite pratique au nombre de VMs qui peuvent partager un GPU. Plus le volume de machines virtuelles qui partagent un GPU est important et plus les demandes graphiques de ces machines virtuelles sont élevées, moins les performances des vGPUs sont bonnes.

Les administrateurs peuvent ajuster les performances en configurant les ressources vGPU. Cela permet d'allouer plus ou moins de "tranches" de temps à une machine virtuelle, de sorte que les machines virtuelles les plus exigeantes bénéficient de plus de temps de fonctionnement du GPU, tandis que les machines virtuelles moins exigeantes ou de test bénéficient de moins de temps de fonctionnement du GPU.

Le plus souvent, le mode vGPU sert à gérer des tâches graphiques légères de tous les jours, telles que l’accélération des éléments graphiques dans un bureau distant, comme c’est le cas dans les environnements de VDI. Dans cette configuration un grand nombre de postes de travail virtualisés utilisent un nombre limité de GPUs.