AA+W - stock.adobe.com

IA sur site : l’offre de Dell séduit sur fond d’explosion des prix

Depuis l’année dernière, Dell propose une stack pour déployer l’IA derrière les murs d’une organisation. Elle a convaincu 200 clients en France. Mais avec les grands chantiers des hyperscalers qui provoquent une tension sur les composants, ses prix vont augmenter. Fortement.

Avoir une partie de son IA sur site est une idée qui fait son chemin. Une preuve parmi d’autres est le nombre de clients français de l’offre IA Factory de Dell, lancée en mai 2024, qui a dépassé la barre des 200 entreprises (pour 3200 clients dans le monde).

« La stack est chez eux, de bout en bout, pour des cas d’usages que l’on n’a pas à connaître », résume Anwar Dahab, DG de Dell en France.

L’échelle du marché des infrastructures d’IA en local est certes sans commune mesure avec les énormes clusters des hyperscalers. Mais ce segment tire tout de même les résultats du constructeur.

Le CHU de Montpellier et Thalès

L’argument de Dell est que les entreprises ont tout à gagner à rapprocher l’IA de leurs données, plutôt que de « refaire les erreurs du cloud » (dixit Anwar Dahab) où les entreprises ont du faire l’inverse, sans jamais réellement le faire totalement d’ailleurs.

Plusieurs clients ont déjà témoigné publiquement en faveur de cette stratégie. Le CHU de Montpellier utilise l’IA Factory de Dell pour gérer le dossier patient et pour préparer en amont les consultations. « Le but est d’optimiser le temps que les praticiens peuvent consacrer aux patients », illustre Anwar Dahab.

Dans la défense, Thales s’appuie également sur ce hardware pour son propre CortAIx.

Plusieurs grandes banques françaises, qui ne souhaitent pas être citées, en feraient de même. Idem pour Atos.

Plus souverain, et moins cher pour l’inférence

Les bénéfices d’avoir l’IA entre ses murs sont multiples : efficacité liée à la proximité des données, maîtrise des modèles, confidentialité des usages sensibles, indépendance technologique, conformité réglementaire, diminution de l’exposition aux lois extra-territoriales.

Et, last but not least, le prix. « Il coûte 75 % moins cher de faire de l’inférence sur site avec des grands modèles de langage comparativement à des services en cloud » vantait Michael Dell lors du lancement de l’offre.

À l’inverse, une récente étude de Publicis Sapient montrait qu’un des freins principaux à cette option « on prem » était le manque de compétences internes des entreprises.

23 % du CA de Dell dans l’IA

Dell ne balaie pas ce constat d’un revers de main. Le constructeur insiste au contraire sur la simplicité d’avoir une offre complète, qui ne se limite pas aux seules GPU.

« C’est une full stack », insiste Anwar Dahab, « il y a le stockage, le réseau, un coffre-fort numérique », égrène-t-il. Et des intégrations, comme avec Mistral. Le tout dans une optique d’hybridation avec le cloud – pour les cas d’usages moins sensibles.

Reste que les 200 clients français ne prennent pas tous la stack complète. Dans le monde, l’offre IA de Dell avoisine les 25 milliards $ sur les 110 de chiffre d’affaires du constructeur. Mais cette catégorie « IA » va des clients qui prennent « au moins un serveur GPU jusqu’à la full stack », nuance le DG France.

Plus globalement, dans le pays, « la tendance est à la mise en production ». Après une phase de POC, les clients français passeraient désormais à l’étape suivante, « de manière raisonnée, en s’appuyant sur des analyses de ROI pour valider la valeur ajoutée ».

Vers une explosion des prix

La popularité d’IA Factory tient peut-être, aussi, au fait que certains clients ont anticipé la hausse des prix à venir, liée aux tensions sur les GPU, sur la mémoire et sur le stockage provoquées par les chantiers pharaoniques des hyperscalers.

Pour les experts du constructeur, le prix de certaines VRAM a été multiplié par cinq depuis septembre. Et si les SSD augmentent moins fortement, ils augmentent quand même, constate Anwar Dahab.

Certes, le constructeur a assuré ses approvisionnements grâce à la relation de longue date qu’il entretient avec ses fournisseurs et grâce à son expérience dans le scénario planning qu’il a éprouvées pendant la pandémie, confie Vivek Mohindra, SVP & Special Advisor au Vice Chairman de Dell.

Mais rien n’y fera : les prix vont continuer à augmenter « et de manière significative », prévient le DG France. « Ce ne sera pas que de quelques pour cent », martèle-t-il.

Une hausse de la production pour servir la demande et baisser les prix n’est par ailleurs pas crédible avant 2027. Pour la VRAM, par exemple, il faudrait compter au minimum deux ans pour construire une usine, chiffre le responsable.

L’offre IA Factory ne pourra donc pas y échapper. « Nos niveaux de marges sont publics. Dans notre industrie, nous ne pouvons pas nous permettre d’absorber un tel choc sans que cela soit répercuté sur les prix », regrette Anwar Dahab. « C’est une réalité. Je discute beaucoup avec les clients, et ils le savent ».

Chasse au « sursizing » et rack au cordeau

La solution pourrait-elle passer par une forme de « shrinkflation IT » ? L’option est envisagée par Dell pour les laptops, avec des machines moins puissantes qui collent au plus proche des besoins (sans aucun superflu). Et pour les serveurs ?

Pas sûr. Mais « [pour faire tourner l’IA], il n’y a pas toujours besoin d’un rack extrêmement cher », assure en tout cas Anwar Dahab.

« Lorsqu’une IA est déployée sur site, les ressources sont dimensionnées en fonction des besoins réels de l’entreprise », ajoute Dell France dans un échange avec LeMagIT. Cette approche permettrait « d’éviter les excès » avec un ajustement plus précis de la capacité par rapport au cloud.

Ces environnements auraient en effet tendance à prévoir une marge importante pour garantir la disponibilité et éviter les blocages. « Ce “sursizing” entraîne une utilisation de ressources supérieure à ce qui est strictement nécessaire, ce qui augmente la consommation énergétique et l’empreinte écologique », pointe Dell France.

Et, donc, aussi le prix. Un argument qui – avec les autres bénéfices avancés pour l’IA sur site – fait que Dell se montre confiant sur le fait que la dynamique de sa Factory va continuer, à l’international comme en France. La France qui, dans ce domaine, « n’est pas en retard », se félicite la filiale locale.

Lire aussi sur l’IA sur site

Dell étend son AI Factory avec de nouveaux serveurs AMD

Dell complète son offre d’infrastructures pour l’IA avec des serveurs basés sur le dernier processeur Epyc 9005 et les conjugue avec des services pour accompagner les entreprises.

Étude : le stockage de données est l’élément bloquant des infrastructures d’IA

Alors que l’IA semble essentielle dans la stratégie des DSI, une étude du cabinet ESG indique que des lacunes persistantes en matière d’infrastructures de données empêchent les projets de grandir.

Industries critiques : Sodern (Ariane) déploie une IA générative sur son infrastructure

L’équipementier Sodern, filiale d’Ariane Group, a choisi une option souveraine pour intégrer l’intelligence artificielle générative dans ses opérations. Une décision motivée par des exigences de sécurité, de confidentialité, et d’indépendance technologique.

Pour approfondir sur Hardware IA (GPU, FPGA, etc.)