Stations de travail : HP lance des modèles pour l’IA sur site

Le fabricant met à jour ses petites stations graphiques avec des modèles équipés d’une toute nouvelle puce d’AMD, le Ryzen AI Max, un SoC qui reprend les bonnes idées des Mac pour accélérer l’IA. Le public visé va désormais au-delà des professionnels de l’image.

Le constructeur HP lancera le mois prochain deux nouvelles stations de travail, la portable ZBook Ultra G1a 14 pouces et la tour minuscule Z2 Mini G1a, qui se veulent des foudres de guerre pour la création 3D et… l’intelligence artificielle sur site.

« Exécuter des LLM depuis sa propre machine permet de s’affranchir des coûts facturés par les IA en ligne au-delà d’un certain volume. Cela sert aussi à leur soumettre des données privées sans les envoyer en cloud public », argumente Cécile Tézenas du Montcel (à gauche sur la photo en haut de cet article), responsable commerciale pour les produits de Data science et d’IA chez HP France.

De fait, le public visé par ces machines s’élargit au-delà de l’habituelle clientèle des professionnels de l’animation et de l’image numérique. HP espère séduire les développeurs d’applications d’IA générative, qui doivent tester sans cesse leurs codes et seraient pénalisés s’ils devaient payer à chaque fois. Et aussi les utilisateurs professionnels, qui passent actuellement des heures à expérimenter des prompts avant de trouver ceux qui les rendront vraiment plus productifs.

Via des logiciels communautaires tels que LM Studio ou Ollama, il est possible d’installer sur ces machines plusieurs LLM bien connus : Gemma 3 de Google, Llama 3.3 de Meta, Claude 3,7 Sonnet d’Anthropic, plusieurs versions de Mistral (Mistral, Mistral Small 3.1, Mistral Nemo, Mixtral), Granite 3.2 d’IBM, Qwen 2.5 d’Alibaba, ou encore DeepSeek R1.

Un SoC similaire à celui des Mac

« Pour qu’une IA fonctionne sur une machine personnelle, il faut que les cœurs de processeurs et les circuits d’accélération vectoriels (GPU) comme matriciels (NPU) accèdent tous ensemble à beaucoup, beaucoup de mémoire », explique Cécile Tézenas du Montcel, confirmant une observation que LeMagIT a pu lui-même faire en expérimentant différents LLM sur des Mac dotés d’une puce Silicon M.

« Pour qu’une IA fonctionne sur une machine personnelle, il faut que les cœurs de processeurs et circuits d’accélération vectoriels (GPU) comme matriciels (NPU) accèdent tous ensemble à beaucoup de mémoire. »
Cécile Tézenas du MontcelResponsable commerciale, produits Data science et IA, HP France

Cécile Tézenas du Montcel n’a d’ailleurs aucun scrupule à dire que HP a imité l’architecture du Mac : « plus exactement, ces machines sont les premières à intégrer les puces Ryzen AI Max d’AMD qui reprennent le principe UMA [Unified Memory Architecture] du SoC Silicon M des Mac. On se rend compte que cette architecture, où chaque circuit de calcul a accès aux mêmes adresses mémoires, est l’accélérateur le plus efficace pour l’IA. Parce que l’application va alternativement choisir d’utiliser un cœur GPU, un cœur CPU ou un cœur CPU pour traiter une même donnée, selon l’action à accomplir », détaille-t-elle.

« Et surtout, cette mémoire partagée peut grimper jusqu’à 96 Go ! Or, si vous réfléchissez bien, il n’y a même pas de carte GPU en PCie qui contienne autant de mémoire à l’heure actuelle », ajoute-t-elle.

Elle compare avec une configuration similaire à base de processeur Intel que HP proposait déjà à son catalogue. Dans celle-ci, le processeur Core Ultra 9 a une mémoire séparée de celle du GPU Nvidia RTX 4000. « Selon nos tests, la version AMD est jusqu’à quatre fois plus rapide sur les mêmes traitements d’IA. »

Jusqu’à 16 cœurs x86, sous Windows ou Linux

Dans les faits, les deux stations de HP reposent sur les modèles de SoC AMD Ryzen AI Max Pro 380, 385, 390 ou 395. Des puces qui s’interfacent directement avec 128 Go de RAM LPDDR5X et dont 75 % sont partagés. Soit exactement comme le SoC M4 Max d’Apple. Les quatre versions correspondent essentiellement à un nombre de cœurs plus ou moins élevé et une fréquence inversement proportionnelle.

  • Le modèle 380 a 6 cœurs x86 cadencés de 3,6 à 4,9 GHz avec 16 Mo de cache et un GPU Radeon 8040S.
  • Le modèle 385 a 8 cœurs cadencés de 3,6 à 5 GHz, avec 32 Mo de cache et un GPU Radeon 8050S.
  • Le modèle 390 a 12 cœurs cadencés de 3,2 à 5 GHz, avec 64 Mo de cache et un GPU Radeon 8050S.
  • Le modèle 395 a 16 cœurs cadencés de 3 à 5,1 GHz, avec 64 Mo de cache et un GPU Radeon 8060S.

Dans tous les cas, tous ces SoC intègrent un NPU capable d’atteindre une performance de 50 TFLOPS. 

La version portable dispose par ailleurs d’un maximum de 4 To de stockage sur un SSD NVMe. Le double pour la mini tour.

La version mini tour est aussi plus richement dotée en connecteurs. On dénombre à l’avant un USB-C et un USB-A en 10 Gbit/s. À l’arrière se trouvent un USB-C en 40 Gbit/s (Thunderbolt 4), quatre USB-A, dont deux en 10 Gbit/s, un connecteur Ethernet RJ45 en 2,5 Gbit/s et deux ports Flex IO, sur lesquels il est possible de brancher les connecteurs de son choix. Les deux connecteurs-écrans sont à la norme Mini DP.

La version portable dispose classiquement d’un connecteur HDMI, d’un connecteur USB-C 40 Gbit/s de chaque côté, ainsi qu’un connecteur USB-C en 10 Gbit/s d’un côté et un connecteur USB-A de l’autre. Les deux machines fonctionnent en Wifi 7.

« Je précise que ces machines sont validées pour fonctionner sous Windows comme sous Linux. Nous disposons d’ailleurs d’une version d’Ubuntu spécialement optimisée pour le SoC d’AMD », conclut Cécile Tézenas du Montcel.

Pour approfondir sur PC, Mac, terminaux et périphériques