Les applications de l'IA et du machine learning ont proliféré ces dix dernières années. Récemment, des modèles d'IA générative – dont GPT-4 et PaLM 2 – qui motorisent des applications telles que ChatGPT et Bard ont rendu l’IA accessible à de nombreux utilisateurs et entreprises qui n'auraient peut-être jamais envisagé l’adoption de ces technologies auparavant.

Malgré la promesse de leurs conceptions, les modèles d’IA ne sont pas « intelligents ». En réalité, le terme « IA » ne désigne guère plus que des systèmes capables de trouver des relations dans de vastes et complexes ensembles de données, puis d'organiser et d'exprimer ces relations à l'intention des utilisateurs de manière intelligible.

Par conséquent, les systèmes d'IA dépendent fortement des techniques d'optimisation. Ces optimisations ont deux objectifs fondamentaux : produire des résultats plus pertinents et améliorer les performances. Les deux principales techniques utilisées aujourd'hui pour optimiser les grands modèles de langage sont le prompt engineering et le fine-tuning.

Qu'est-ce que le prompt engineering ?

L'un des plus anciens axiomes de l'informatique est « garbage in, garbage out » — une phrase qui est tout aussi vraie à l'ère de l'IA qu'elle l'était lors de la programmation des premiers mainframes.

Les systèmes d'IA ne sont ni psychiques ni télépathiques. Parce qu'ils ne peuvent pas deviner ou reconnaître les intentions ultimes de l'utilisateur, ils sont totalement dépendants des données qui leur sont fournies. Les questions ou demandes qu'un utilisateur pose à une application telle que ChatGPT sont appelées prompts, ou invites (parfois requêtes ou commandes) en français.

Lorsqu'un utilisateur saisit une invite, l'IA analyse – décompose ou désassemble – les principaux éléments de ce prompt. Le système utilise ensuite ces éléments pour traiter les données, produire des résultats ou prendre des mesures.

Par conséquent, la qualité et l'exhaustivité des résultats de l'IA sont fortement influencées par la qualité et la précision de la requête écrite par l'utilisateur. En bref, une IA générative produit des résultats pertinents et précis si l'utilisateur pose des questions... plus pertinentes et plus précises.

Le prompt engineering consiste à guider et à façonner les réponses des modèles de ML en s'appuyant sur le travail du prompt engineer. Son rôle est de formuler soigneusement des requêtes spécifiques.

Pour obtenir des résultats cohérents, c’est-à-dire plus alignés sur la demande d’un humain, un prompt engineer ajoutera du contexte à son invite. Par exemple, pour générer un template de mail qui servira lors d’une campagne marketing, le prompt engineer décrit cette tâche, renseigne l’objectif et ajoute un ou plusieurs exemples de courriels qui correspondent à sa requête.

Le processus d'optimisation des invites implique souvent de poser des questions de plus en plus pointues et détaillées ou de tester différentes façons de formuler les instructions. L'objectif est d’influencer le comportement de l’IA pour obtenir des résultats probants. Pour ce faire, les prompt engineers expérimentent généralement différents types de requêtes et de formats.

Si l’approche semble à la portée de tous utilisateurs qui souhaiteraient exploiter un grand modèle de langage (LLM), elle réclame une connaissance approfondie de son architecture et des contraintes liées aux jeux de données exploitées à l’entraînement.

Si le prompt engineer connaît le corpus qui a été utilisé pour l’entraîner (tout du moins en partie), il saura identifier les tâches dans lesquelles le LLM est performant et, à l’inverse, celles qui provoquent des hallucinations.

Les modèles de générations d’images sont de bons exemples pour comprendre ce principe. Par exemple, les différentes versions de Stable Diffusion et de Midjourney réagissent à des prompts et des « negative prompts ». Ici, il s’agit de renseigner les concepts positifs, ceux que l’on souhaite faire apparaître dans l’image générée d’un côté, et les éléments négatifs, ceux qui ne doivent pas être présents dans l’image finale de l’autre. Ce n’est qu’en expérimentant et en générant différentes images que l’usager peut identifier les termes positifs et négatifs qui ont le plus d’effets sur les sorties du modèle.