Il se présente comme le « plus grand laboratoire privé d’IA en Europe ». Fondé en 2017, le Finlandais Silo AI a tapé dans l’œil du concepteur de CPU et de GPU AMD. Le groupe basé à Santa Clara a déclaré qu’il engage 665 millions de dollars en cash pour acquérir ce spécialiste. La transaction devrait être clôturée dans « la seconde moitié de 2024 ». L’actuel dirigeant de Silo AI, Peter Sarlin, conservera son rôle de directeur des équipes sous l’autorité de Vamsi Boppana, vice-président sénior du groupe intelligence artificielle chez AMD.

Un spécialiste de l’IA scandinave

« L’équipe d’experts en IA de Silo AI, forte de son expérience dans le développement de modèles et de solutions d’IA de premier ordre, y compris des modèles de langage de pointe entraînés sur des plateformes AMD, contribuera à accélérer notre stratégie d’IA », déclare-t-il, dans un communiqué de presse. « Cela facilitera également le développement et la mise en œuvre rapide de solutions d’IA pour nos clients à l’échelle mondiale ».

Silo AI, réputé pour employer 300 ingénieurs et data scientists (dont 125 détenteurs d’un doctorat), dit avoir accompagné plus de 200 projets d’IA chez Philips, Rolls-Royce, Unilever, Allianz et d’autres. Par ailleurs, il a entraîné deux collections de grands modèles de langage, Poro et Viking, sur des jeux de données composés de textes rédigés dans plusieurs langues nordiques (finnois, danois, islandais, norvégien, suédois). Enfin, il développe SiloGen, une plateforme « LLM as a Service » consacrée à la personnalisation, le déploiement et l’optimisation des modèles d’IA générative.

AMD précise qu’il a investi 125 millions de dollars dans une douzaine de startups d’IA ces douze derniers mois, en sus d’acquérir Nod.ai (optimisation des traitements d’IA) et le Français Mipsology (inférence sur FPGA).

Ces deux startups étaient déjà spécialisées dans les technologies d’AMD. C’est aussi le cas de Silo AI. Il a entraîné ses LLM sur la partition GPU du supercalculateur LUMI installé en Finlande. Par exemple, Viking a été entraîné sur 1024 des 11 912 GPU AMD MI250X du HPC (soit 2 978 nœuds de quatre GPU chacun assisté par un CPU AMD Trento). Puissance totale : 379 pétaflops.

Ici, AMD tente donc de valoriser ses GPU, face à un Nvidia hégémonique. Souhaitant montrer patte blanche, l’entreprise de Santa Clara a ouvert son framework concurrent de CUDA, ROCm.

De ce côté-là, Nvidia a plusieurs années d’avance, près de dix ans. Surtout, l’entreprise au caméléon a rendu son middleware propriétaire compatible avec l’ensemble de ses GPU favorisant une adoption massive dans les communautés ouvertes, tandis qu’AMD maintient une prise en charge limitée privilégiant ses cartes graphiques professionnelles et dédiées aux datacenters.