happystock - stock.adobe.com

Alibaba change de stratégie IA et perd les têtes pensantes de Qwen

En interne, le géant chinois admet avoir mal géré ce virage plus commercial qu’il entame en unifiant ses capacités de recherche et en promettant davantage de ressources de calcul disponibles en interne. Les observateurs craignent un pas en arrière en matière d’open source.

Tongyi, le laboratoire de recherche en IA d’Alibaba est en crise. Sa division la plus populaire, Qwen AI, vient de perdre son leader technique, Junyang Lin, et trois autres membres clés de l’équipe. Ils ont annoncé leur démission le 3 mars sur X (ex-Twitter).

Les performances des modèles Qwen, dont ceux de la dernière collection en date Qwen 3.5 lancée à partir de la mi-février (des déclinaisons SLM ont été publiées cette semaine), et leur caractère open weight ont fait la renommée du laboratoire à l’international. Les LLM en question ont été téléchargés plus de 1 milliard de fois. Selon Alibaba Cloud, il existe plus de 200 000 modèles dérivés des travaux de Tongyi.

L’application mobile Qwen App a atteint 203 millions d’utilisateurs en février contre 31 millions un mois plus tôt, selon Reuters.

Une renommée qui ne satisfait pas totalement le groupe Alibaba. Oui, l’exécution des modèles open weight et de leurs déclinaisons propriétaires rapporte de l’argent au fournisseur de cloud. Il observait en novembre une croissance à trois chiffres de ses produits liés à l’IA. Cependant, il n’est pas en mesure de concurrencer commercialement les compétiteurs américains, OpenAI, Anthropic et surtout Google. De plus, des acteurs comme MiniMax, Moonshot AI ou Zhipu AI (Zai) gagnent du terrain en Chine et dans le reste de l’Asie.

Ce 5 mars, Reuters a révélé le contenu d’un courriel interne envoyé aux employés de la branche IA d’Alibaba. Il explique que le groupe a décidé d’un changement de stratégie IA. Elle passe par une réorganisation des équipes sous la direction de Zhou Jingren, CTO d’Alibaba Cloud et suivi de près par Eddie Wu, CEO d’Alibaba et d’Alibaba Cloud. Zhou Jingren reste à la tête du laboratoire Tongyi. Le 2 mars, Alibaba a annoncé rassembler ses efforts d’IA sous une seule marque : Qwen.

Alibaba mise sur la marque Qwen, mais veut unifier ses équipes

L’objectif est d’accélérer le développement des modèles de fondation et leur commercialisation. L’équipe derrière Qwen réclamait une augmentation de leurs moyens humains et techniques pour poursuivre leur mission.

Selon le média économique chinois 36Kr, le départ soudain de Junyang Lin semble dû à des « lacunes de communication », admises par la direction d’Alibaba lors d’une réunion de crise ayant eu lieu le 4 mars.

Le projet était, selon les sources disponibles, de subdiviser les équipes de préentraînement, post entraînement et de compréhension visuelle dédiées à Qwen AI pour les fusionner avec d’autres au sein du laboratoire Tongyi (Wanxiang pour la génération d’images, Bailing, pour la voix).

Dans un même temps, Alibaba cherche à recruter davantage de chercheurs et d’ingénieurs, considérant qu’une centaine de personnes ne suffit plus. À titre de comparaison, en décembre 2023, LeMagIT indiquait que Google a mobilisé près de 1000 personnes pour entraîner Gemini 1.

Un peu avant l’annonce de cette réorganisation, Alibaba a recruté Hao Zhou, ancien chercheur senior chez Meta, puis Google DeepMind. Des rumeurs circulaient selon lesquelles il prendrait la place de Junyang Lin. La direction a confirmé qu’Hao Zhou craignait de ne pas être intégré dans l’équipe Qwen AI et avait donc demandé à être placé sous la direction du CTO d’Alibaba Cloud, en attendant que son rôle soit clairement défini. Ce qui n’est, officiellement, toujours pas le cas.

Les lacunes de communication expliqueraient également la difficulté d’accès à la puissance de calcul par les équipes de Qwen, d’après les propos rapportés d’Eddie Wu. Le directeur technique Zhou Jingren mentionne de son côté une « pénurie de ressources » qu’il tente de combler à large échelle, sans préciser comment.

Alibaba et les entreprises chinoises doivent faire avec les interdictions et limitations d’export imposées à Nvidia. Alibaba a déployé 10 000 clusters équipés de sa propre puce IA, la Zhenwu 810E. Un composant dont la puissance est comparable au GPU H20 de Nvidia, une version tronquée du H100 vendue en Chine. Pour l’instant, les clusters sont réservés à 400 clients.  

Un déclin de l’IA open source chez Alibaba ?

Depuis 2023, Junyang Lin (qui a été recruté en 2019 par Alibaba) était reconnu comme l’instigateur des projets open source au sein du laboratoire. Il est, selon ses pairs, un des moteurs du succès de Qwen. Personne n’est irremplaçable, ont déclaré en substance Eddie Wu et les autres membres de la direction d’Alibaba. Le collectif est la clé.

Plusieurs observateurs voient l’arrivée d’un ancien de Google DeepMind ayant travaillé sur le lancement de Gemini 3, comme l’indice d’un désintérêt progressif de l’approche open weight chez Alibaba. Officiellement, le groupe chinois n’a pas fait une croix sur l’open source et l’innovation ouverte. Ces deux aspects font partie intégrante de la doctrine étatique locale. Elle a permis l’émergence de véritables concurrents aux startups américaines.

Une autre voie existe et il ne serait pas surprenant de voir Alibaba l’emprunter. Chez Google, les modèles ouverts sont développés par une autre équipe et portent le nom Gemma. Les écarts de performance entre Gemma et Gemini sont suffisamment importants pour justifier un engagement financier de la part des clients.

Des départs fréquents au sein de l’écosystème IA

Tongyi n’est pas le seul fournisseur de LLM à avoir perdu une de ses figures clés cette semaine. Le 3 mars, Max Schwarzer, vice-président de la recherche et ex-directeur du post-entraînement chez OpenAI, a annoncé avoir quitté l’entreprise dirigée par Sam Altman pour rejoindre les rangs du concurrent direct, Anthropic. Max Schwarzer évoque le désir de reprendre des activités de recherche pure. « J’envisage de retourner à la recherche technique depuis un certain temps, et je suis convaincu que mes collègues et mon équipe sont parfaitement préparés à poursuivre sur cette voie sans moi », écrit-il.

Son départ n’est officiellement pas lié à l’accord signé par OpenAI avec le département de la Défense (« Department of War ») américain le 2 mars, après le refus d’Anthropic de l’usage de sa technologie pour la surveillance de masse domestique et la création d’armes autonomes. OpenAI dit avoir pris des dispositions contractuelles et techniques afin d’éviter ces cas d’usage.

Selon le site Web 7min.ai qui suit les mouvements de talents chez les laboratoires d’IA depuis 2010, OpenAI est le plus impacté par ses départs (64 depuis sa création, dont Dario Amodei, cofondateur et CEO d’Anthropic), suivi par Google (58).

Pour approfondir sur IA appliquée, GenAI, IA infusée