studiostoks - Fotolia

McKinsey : 60 000 employés, dont 25 000 agents IA

Le cabinet de conseils utilise déjà de l’IA agentique à grande échelle, que ce soit pour la production de code, des processus RH ou chez ses clients. Un de ses enseignements est de l’utiliser pour augmenter l’Humain, pas pour le remplacer. Et de ne pas négliger la couche d’observabilité.

« Les entreprises qui font bien de l’IA et qui en tirent de la valeur le font avec un couplage agent-humain ». Ce constat est celui d’Arnaud Tournesac, directeur associé chez McKinsey. Il est devenu une règle au sein du prestigieux cabinet de conseils qui a embrassé massivement l’IA générative et même l’IA agentique.

Les promesses des éditeurs tempérées par la réalité

Mais McKinsey ne se laisse pas aveugler par les communications marketing des éditeurs autour d’agents complètement autonomes capables de prendre en charge, seuls, un workflow de bout en bout. « Il y a eu pas mal d’illusions sur les gains qu’on allait avoir », constate Arnaud Tournesac avec le recul.

Or dans les faits, même des performances élevées restent insuffisantes pour certains processus critiques. « Chez un client, pour traiter les demandes de commandes, la partie LLM + agent atteignait 99,2 % d’exactitude », relate-t-il. « Mais le client ne veut pas perdre 1 % de ses commandes ».

Une des conséquences immédiates pour déployer l’IA dans ce contexte est de remettre l’humain dans la boucle. Car « quoi qu’il arrive, il y a un certain nombre de demandes, de décisions de pricing qui sont difficiles à modéliser. On a besoin d’humains derrière. »

Pour l’expert, l’illusion concernerait aussi les retombées. Elles existent, mais elles seraient beaucoup plus mesurées que ce qu’attendent certains décideurs. Sur les projets qu’il mène sur le terrain, McKinsey constate des gains de productivité de 20 à 30 %. « C’est très intéressant, mais ce n’est pas 80-90 % », tempère Arnaud Tournesac.

Trois grands domaines pour l’IA agentique

Selon McKinsey, l’IA est aujourd’hui utilisée en interne et chez ses clients dans « trois grands domaines ». Le premier concerne le knowledge management, notamment pour les fonctions juridiques ou l’accès à la documentation. Le second touche le marketing et les ventes, avec des gains sur la génération de campagnes et d’offres personnalisées. Le troisième, qui serait le plus mature, est l’IT.

« Aussi bien sur le build que sur le run », insiste Arnaud Tournesac

Sur le run, Arnaud Tournesac évoque le cas concret d’un service desk, sur lequel il a travaillé et où « 80 % des tickets passent à présent par l’agent en L1 ». Le gain global reste toutefois « de l’ordre de 20 à 30 % », une partie des tickets nécessitant toujours une intervention humaine de niveau supérieur.

L’agentique et le développement logiciel

Côté build, McKinsey observe une transformation profonde des processus pour produire du code. « Nous sommes en train de développer une marketplace », illustre Arnaud Tournesac. Un projet qui aurait pris « entre six mois à un an » et qui devrait sortir « en moins de trois mois » grâce à l’IA.

Mais le directeur associé est d’accord avec le directeur délégué en charge des centres de compétence de la SNCF, l’IA n’est pas un magiciel.

 « On fait vraiment du “spec driven development” », insiste-t-il. Le processus enchaîne le design dans Figma, la génération et la revue de « user stories » dans Jira, un cadrage par des architectes, la génération de code dans Cursor, puis un contrôle qualité automatisé avec une autre IA, avant l’intégration dans un pipeline CI/CD classique.

Et lorsque cela ne fonctionne pas, « 80 % du temps, plutôt que de modifier le code, on modifie soit la “user story”, soit le design, soit l’architecture ».

Avec cette nouvelle approche très IA, McKinsey atteint presque des sprints d’une journée. Et Arnaud Tournesac évalue des gains de productivité de 30 % à 50 %.

Les développeurs restent indispensables, martèle-t-il, ne serait-ce que parce qu’il faut « une revue par des experts » pour garantir qualité et sécurité. Mais « leur façon de travailler est très différente » avec un rapprochement marqué entre les rôles de « product owner » et de développeur.

25 000 agents pour augmenter les métiers

Le cabinet applique l’IA à d’autres processus. « Chez McKinsey, on dit que nous avons 60 000 employés dans le monde dont 25 000 sont des agents », lance Arnaud Tournesac. Là encore, l’objectif ne serait pas de remplacer des fonctions, mais d’accompagner chaque métier par des agents spécialisés.

Les usages vont de la préparation de briefs pour des dirigeants aux processus RH comme l’évaluation des collaborateurs. « Nous mettons un accent particulier sur le développement de nos consultants, ils sont évalués deux fois par an », explique Arnaud Tournesac. L’exercice est chronophage pour les partners. « Je dois appeler plus d’une quinzaine de personnes pour faire des synthèses. On a augmenté tout cela avec des agents. Ils font les premières synthèses, des recommandations de training, etc. Évidemment, j’ai la responsabilité à la fin de revoir le mémo. », précise-t-il.

Mais le gain est substantiel : « je pense que j’ai gagné entre 50 et 60 % de mon temps sur ce genre de processus. »

Gouvernance, responsabilité et « RH des agents »

Le modèle humain-IA soulève cependant des questions de gouvernance.

« Qui est responsable de la qualité de ce qu’il sort [N.D.R. : les réponses] ? Qui est responsable de l’évolution de l’IA ? De son réentraînement ? », interroge Arnaud Tournesac. Pour lui, « ce sont presque des questions RH, qu’il y a derrière un agent ».

À ces questions stratégiques s’ajoutent des questions techniques, qui dépassent de loin les seuls cas de McKinsey. Que faire si un agent est bloqué dans des discussions avec un autre agent ? Quelle est la porte de sortie ? « Ce sont toutes ces questions sur l’organisation agentique d’une entreprise qu’il va falloir résoudre demain ». Car ces réponses conditionneront la confiance que l’on peut placer dans ces systèmes.

« [Globalement], nous allons de plus en plus avoir besoin d’ingénierie et d’observabilité pour générer des revues de ce qui se passe », prédit-il. « On sent bien que ces couches de vérification, d’observabilité, d’orchestration vont avoir une importance critique. »

L’observabilité, prérequis à la confiance

Cette couche est d’autant plus stratégique qu’elle conditionnera aussi le contrôle des agents à grande échelle. Avec à la clef un nouveau risque de dépendance à un seul grand fournisseur IT (Salesforce, ServiceNow, Microsoft, AWS, etc.).

McKinsey consacre en tout cas « beaucoup de temps » à monitorer les sorties de chacun de ses agents et à tracer la logique de décision (le « chain of thoughts ») pour « sortir de ce côté black box et avoir un log constant des informations utilisées et des étapes suivies par l’IA ».

Aujourd’hui, ce travail est encore largement manuel. Et il s’appuie sur des frameworks open source, en attendant l’émergence de plateformes plus performantes, comme les Français de XPDeep – cite Arnaud Tournesac.

Une centaine d’agents modernisent du COBOL

Reste que McKinsey se montre prudent sur la maturité réelle du marché de l’agentique.

« Des choses à l’échelle sur du processus critique, vous n’allez pas en trouver des dizaines », reconnaît Arnaud Tournesac.

L’agentique reste donc le plus souvent limitée à un agent, même si le cabinet commence à déployer des suites d’agents, comme « dans une banque pour faire de la modernisation, avec une centaine d’agents qui interagissent sur du code COBOL », confie le partner.

Pour approfondir sur IA appliquée, GenAI, IA infusée