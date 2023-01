Avant même qu’il fasse grand bruit auprès du grand public avec son agent conversationnel ChatGPT et son générateur d’images Dall-E2, Microsoft a acheté l’exploitation commerciale des modèles de génération de textes en langage naturel (NLG) d’OpenAI.

OpenAI propose avant tout des modèles d’IA capables de traiter des textes, des images et du code, déclinés à partir d’un modèle de langage fondamental : GPT-3. Ses déclinaisons ont été entraînées sur un superordinateur mis sur pied par Microsoft.

Depuis lors, Microsoft incorpore ces technologies dans différents services. L’entreprise a commencé par exploiter Codex, le modèle de génération de code d’OpenAI, pour lancer GitHub Copilot. Elle utilise les modèles GPT-3 pour enrichir les capacités d’Azure Cognitive Services et de Power BI, tandis que ses équipes développent Microsoft Designer, un outil reposant sur le modèle sous-jacent de l’application Dall-E 2 pour créer du contenu marketing et des mockups. Comme prévu en novembre 2021, Microsoft a lancé la disponibilité générale d’Azure OpenAI.

En outre, Microsoft permet à ses clients de protéger les données d’entraînement et les modèles personnalisés au repos à l’aide de leurs propres clés de chiffrement. Azure OpenAI prend en charge Customer LockBox, afin de gérer ou de limiter l’accès des données aux responsables du support de Microsoft, en cas de panne. Comme la plupart des services proposés par le fournisseur, Azure OpenAI supporte Azure AD, ainsi que les outils de supervision Azure Resource Health, Cost Analysis et Metrics & Diagnostics.

Réservé aux développeurs et aux équipes de data science, Azure OpenAI est une édition entreprise des services actuellement proposés par la startup. Azure OpenAI reprend les API REST d’OpenAI, mais donne également la possibilité d’accéder aux modèles issus de GPT-3.5 depuis un SDK Python et le Studio Azure OpenAI.

Trois grandes familles de modèles

Dans le détail, Azure OpenAI donne accès à trois familles de modèles. Les modèles estampillés GPT-3 (ou série de base) peuvent comprendre et générer du texte. Les modèles Codex expliquent et génèrent du code, tandis que les modèles Embedding sont capables de comprendre et d’utiliser des représentations vectorielles de textes et de code facilement interprétables par des modèles de machine learning et de deep learning.

Dans chacune de ces catégories, le service permet d’utiliser les modèles ad hoc ou affinés (fine tuned en VO). Par exemple, dans la famille GPT-3, il existe quatre grands modèles plus ou moins généralistes : Ada, Babbage, Curie et Davinci.

Ada est le modèle le plus rapide, mais également le plus simple : il permet d’extraire des entités nommées dans un texte, d’effectuer des classifications, de corriger des adresses ou de repérer des mots-clés.

Babbage est réservé à la classification et au classement de la correspondance entre des documents et les éléments d’une requête dans un moteur de recherche.

Plus étoffé, Curie permet d’effectuer des classifications complexes, des traductions, des analyses de sentiment et des résumés.

Enfin, Davinci est le modèle le plus complet : il comprend des intentions complexes, des relations de cause à effet, il effectue des résumés pour différents types d’audience, etc. Il est aussi le plus coûteux. Ce qui les différencie ? Leur profondeur de dimension, le nombre de paramètres, le temps d’entraînement et les jeux de données utilisés. Dans le doute, Microsoft et OpenAI recommandent d’utiliser Davinci.

Plus tard, Microsoft donnera accès par API à Dall-E 2 et à ChatGPT aux entreprises à travers Azure OpenAI afin que les développeurs intègrent eux-mêmes les sorties de ces deux modèles dans leurs applications.

Le géant du cloud est tributaire de son partenaire. En novembre dernier, OpenAI a fourni une API pour son modèle de génération d’images DALL-E 2, accessible en bêta publique. Concernant ChatGPT, OpenAI vient de lancer une liste d’attente pour obtenir l’interface de programmation par-dessus la technologie qui motorise l’agent conversationnel. Il faut donc bien distinguer l’offre technique Azure OpenAI des applications Web proposées aux grands publics par OpenAI.