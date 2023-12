Avec l’émergence fulgurante de l’IA générative, les géants du cloud ont massivement investi dans les startups à la source de ces modèles gourmands en ressources de calcul et dans leurs propres équipes.

Non seulement ces géants et leurs partenaires ont les fonds, mais aussi les moyens humains pour mener à bien leurs projets. L’affaire de l’éviction puis la réintroduction de Sam Altman, PDG d’OpenAI, a permis de mettre en lumière les plus de 700 employés de la licorne. Anthropic, sa rivale, compte 160 collaborateurs, tandis que le Canadien Cohere revendique plus de 200 salariés.

Leurs concurrents français et européens – Mistral AI, LightOn et Aleph Alpha – doivent respectivement compter sur 22, 26 et environ 50 collaborateurs.

Certes, ces acteurs se sont réellement lancés après OpenAI. Ont-ils une chance face à ces mastodontes ? Disposent-ils des capacités humaines pour développer des modèles capables de rivaliser avec les LLM les plus populaires ?

Pour tenter de répondre à cette question, il faut se pencher sur les articles de recherche et les livres blancs publiés en complément des modèles eux-mêmes.

Ils permettent de chiffrer, voire d’identifier les individus qui entraînent et développent les modèles.

Si OpenAI ne révèle plus les clés de sa réussite, elle crédite les contributeurs principaux à l’entraînement et au développement de GPT-4. LeMagIT a énuméré 290 individus ayant participé à la conception, l’entraînement, le déploiement, la supervision, l’affinage, l’habillage, la commercialisation, la communication autour de cette collection de LLM.

Environ 70 personnes comptabilisent au moins cinq contributions aux tâches répertoriées dans l’article. Un peu plus de 50 ingénieurs et chercheurs ont réalisé plus de 5 tâches, certains jusqu’à 11 tâches différentes. Ce même rapport répertorie officiellement 87 contributeurs principaux. Dans l’article de recherche consacré à GPT-3 et publié en juillet 2020, OpenAI énumère 31 chercheurs et ingénieurs.

Plus de 940 personnes créditées pour faire naître Gemini

Chez Google, les chiffres sont frappants. Le rapport publié en mai 2023, qui accompagnait la sortie de PaLM 2, répertorie 128 contributeurs. Pour Gemini, Google a rapproché les équipes de Google Research, de DeepMind et d’autres laboratoires pour un total de… 943 personnes ayant travaillé sur le projet. Le livre blanc publié le 6 décembre liste 36 responsables d’équipes, deux responsables du programme Gemini, et deux responsables techniques. À cela s’ajoutent 418 contributeurs principaux et 485 contributeurs ayant partiellement travaillé au développement de la collection. En octobre 2022, Google Research listait 67 contributeurs dans l’article de recherche consacré à PaLM, premier du nom. Depuis, les équipes de Google Research et de DeepMind sont sous la même direction. Pour rappel, le projet fondateur de l’ère de naissance des grands modèles de langage (l’architecture Transformer décrite par l’article « Attention is all your need » en 2017) est le fruit du travail de huit chercheurs de Google.

Et du côté de Meta ? L’article consacré à Llama 2 mentionne 68 contributeurs principaux, mais les chercheurs précisent qu’une « équipe de plus de 350 personnes » a été constituée pour réaliser les efforts de red teaming. En février 2023, Meta publiait l’article accompagnant Llama 1. Le projet était mené par 14 chercheurs et ingénieurs, dont Guillaume Lample, un des cofondateurs de Mistral AI. Chez la startup française, le petit rapport technique consacré à son premier modèle, Mistral 7B, référence, lui, 17 personnes ayant travaillé sur le projet.

Pour Laurent Daudet, cofondateur et PDG de LightOn, les approches d’OpenAI et de Google sont « un peu extrêmes ». « Regardez l’article consacré à la collection de modèles open source Falcon auxquels les chercheurs de LightOn ont participé, il liste 12 à 15 personnes. Certes, GPT-4 reste devant, mais Falcon 180B et l’un des meilleurs modèles au monde actuellement », affirme-t-il. En effet, la « Falcon LLM Team » se compose exactement de 14 personnes. Dans la fiche technique consacrée à Alfred 40B-1023 (pour octobre 2023), le modèle dérivé de la variante à 40 milliards de paramètres, l’on apprend que six personnes ont mené ce projet de fine-tuning.

Il n’est pas compliqué de comprendre cette propension soudaine des GAFAM à peupler leurs équipes. Le succès de ChatGPT a provoqué une ruée vers l’or chez les géants de la Tech. L’organisation mise en place par OpenAI montre bien qu’il ne s’agit plus seulement d’entraîner des LLM, mais de préparer leur commercialisation à grande échelle.