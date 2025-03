Les ingénieurs chargés de veiller au bon fonctionnement des systèmes mondiaux sont confrontés à une courbe d’apprentissage abrupte – et à certains égards sans précédent – à mesure que l’IA générative prend une place centrale dans l’informatique.

Ce fut le sujet de discussion dominant de la SREcon Americas 2025 cette semaine. De la session générale de lancement par un vice-président d’entreprise de Microsoft sur les leçons tirées de la construction de Microsoft Azure Copilot aux sessions de type « bird-of-a-feather » et aux discussions de couloir sur les opérations de grands modèles de langage (LLMOps).

L’IA générative crée un changement profond dans la façon dont les systèmes se comportent et, par conséquent, un changement profond dans la façon dont ils doivent être gérés, déclare Niall Murphy, cofondateur et PDG du fournisseur d’outils SRE Stanza Systems. Niall Murphy est plus connu dans l’industrie comme l’un des coauteurs du livre fondateur de Google « Site Reliability Engineering » en 2016.

Avec le LLMOps, « nous entrons dans un monde où le déterminisme en ce qui concerne la gestion d’un système a disparu, et nous sommes dans une gestion probabiliste », avance M. Murphy lors d’une interview avec Informa TechTarget. « Ainsi, un grand nombre de techniques, de mentalités et d’approches issues de la cybernétique des années 1950 doivent être remplacées par des éléments tels que les signaux de confiance et les approches qui tentent de prendre en compte la globalité d’un système plutôt qu’une réponse spécifique ».

Microsoft Azure Copilot : les leçons apprises Brendan Burns, vice-président de Microsoft, a partagé certaines des premières expériences de son entreprise en matière de gestion probabiliste lors du déploiement de Microsoft Azure Copilot au cours d’une présentation en session plénière mardi. Parmi les problèmes qui ont surgi pour l’équipe qui a construit Azure Copilot, il y a eu un changement majeur dans les systèmes de test, de débogage et d’observation, signale-t-il. « Il est évident que nous allons surveiller les mêmes choses : renvoyons-nous les résultats avec succès ? Quelle est la latence ? Rien de tout cela ne change, mais cela ne veut plus dire que votre système fonctionne correctement », souligne Brendan Burns. « Et ce qui va nous dire si votre système fonctionne bien, c’est le retour d’information de l’utilisateur ». Cela signifie que le signal le plus important pour les équipes SRE et DevOps qui gèrent une application basée sur le LLM est le « pouce en l’air » ou le « pouce en bas » de l’utilisateur. Ces avis peuvent être quantifiés avec des mesures statistiques telles que le net promoter score et la satisfaction nette. En fin de compte, « l’on se rapproche davantage de la collecte d’opinion sur les réseaux sociaux que d’un dispositif de mesure précise », compare Brendan Burns. Mesurer le comportement humain est pour le moins délicat. Par exemple, l’équipe Azure Copilot a remarqué qu’une panne à n’importe quel endroit du système Azure avait tendance à fausser négativement les évaluations humaines des copilotes. « Si Azure subit une panne générale… le net promoter score des outils clients chute simplement parce que les gens sont un peu grincheux », déclare-t-il. « Ce n’est pas si différent de comprendre si cette panne est due à une défaillance de mon système ou d’une dépendance en aval, mais c’est beaucoup plus flou ». Le prompt engineering a introduit un nouveau problème pour l’équipe Azure Copilot, poursuit M.Burns. « Dans ces systèmes, le prompt – et en fait, il s’agit plutôt du métaprompt, de ce que vous mettez autour du prompt – est le code », explique-t-il. « Ainsi, les mêmes choses auxquelles vous pensez lorsque vous déployez un logiciel, vous devez y penser lorsque vous déployez le prompt. Tout changement à ce niveau peut avoir un impact très important sur la qualité globale du système que vous êtes en train de construire ». Les applications LLM sont encore en cours de maturation, notamment en ce qui concerne les approches structurées de versionnement et de développement de méta-prompts, selon Brendan Burns. « Aujourd’hui, nos environnements de développement intégrés (IDE) ne sont pas vraiment conçus pour gérer ces aspects ou permettre un versionnement indépendant », précise-t-il. « Le fait que ces éléments soient directement intégrés au code pose problème, car il serait préférable de pouvoir les faire évoluer séparément. Nous sommes encore en train d’explorer les meilleures approches pour le développement logiciel dans ce domaine. »