Ascannio - stock.adobe.com
Toutes les annonces (ou presque) consacrées à ChatGPT en décembre
OpenAI a terminé la livraison de ses douze séries d’annonces diffusées sous la forme d’un (demi) calendrier de l’avent, du 5 au 20 décembre 2024. Son défi ? Maintenir son avance face aux autres produits du marché, dont celles de Microsoft, Google Cloud et Anthropic.
Si la majorité des annonces concernent ChatGPT, qui dispose désormais d’une ceinture d’outils, OpenAI entend constituer une suite de produits pour l’ensemble des usagers de ses LLM. Ici, nous nous concentrons sur la « star » ChatGPT, mais LeMagIT publie un second article consacré aux fonctionnalités ciblant les développeurs et aux chercheurs.
Les annonces d’OpenAI de décembre en un coup d’œil
- Pour les particuliers/usagers individuels :
- ChatGPT Search : OpenAI donne aux LLM l’accès au Web.
- Projects permet d’organiser plusieurs conversations et documents pour mener un petit projet.
- Canvas, une fonction pour interagir avec les LLM GPT sur du code ou du texte.
- ChatGPT dans Apple Intelligence offre la possibilité d’utiliser ChatGPT depuis l’iPhone, l’iPad ou un Mac.
- Advanced Voice Mode donne maintenant accès aux modèles GPT à la vidéo et au partage d’écran.
- ChatGPT 01-800 est interrogeable à la voix depuis un numéro de téléphone aux États-Unis.
- Work with Apps : un moyen pour faire interagir les modèles GPT avec des applications de bureau à travers ChatGPT Desktop.
- Accès au modèle o1 et o1 pro, sortie de sa préversion, depuis ChatGPT.
- Disponibilité partielle de Sora et Sora Turbo, des LLM de génération de vidéos.
Il y a d’abord la mise à disposition à tous les utilisateurs connectés de ChatGPT Search, un moteur de recherche testé en juillet, puis présenté formellement en octobre dernier. L’outil permet d’ancrer les réponses des grands modèles de langage sous-jacents (GPT-4o, GPT-4o mini) avec des résultats majoritairement en provenance de Microsoft Bing. L’outil affiche des images, et des vidéos en provenance de YouTube dans les sessions avec les LLM.
ChatGPT, promis à devenir l'inspecteur Gadget de la bureautique
En octobre dernier, OpenAI avait aussi présenté Canvas, un moyen de « collaborer » – ou plutôt – de faire évoluer un document de manière itérative à l’aide des LLM. Il est désormais accessible par tous les utilisateurs, à l’instar d’Artefacts dans Claude.ai d’Anthropic.
Ainsi, il est possible d’éditer un texte ou une portion de code. Dans le cadre de l’édition de texte, Canvas peut suggérer des modifications, ajuster la longueur du contenu, changer le style suivant l’audience cible, vérifier les fautes de syntaxe et de grammaire ou encore ajouter des emojis.
Pour les développeurs, l’outil fournit des raccourcis pour revoir du code, le commenter, ajouter des logs, corriger des bugs ou encore convertir du code en JavaScript, TypeScript, Python, Java, C++ ou PHP.
En sus de Search et Canvas, OpenAI a présenté Projects pour les utilisateurs payants de ChatGPT Plus, Pro et Team. Les projets doivent combiner des discussions, des fichiers et des instructions personnalisées dans une seule session. Il s’agit surtout d’un moyen d’organiser des conversations dans des dossiers. OpenAI a par ailleurs introduit un moyen de chercher des résultats dans les conversations passées.
En clair, il s’agit de donner des capacités légères de génération augmentée par la recherche pour de petits projets comme la préparation de réunion, apprendre ou réviser un sujet. Plus tard, OpenAI prévoit de connecter cet outil à Google Drive et OneDrive de Microsoft, ainsi que de laisser le choix du LLM sous-jacent.
Sur le papier, c’est une fonctionnalité concurrente à Agentspace et NotebookLM de Google Cloud, dont le fournisseur a récemment présenté une version Pro et entreprise. « L’accès [aux projets] sera étendu aux utilisateurs Enterprise et Edu en janvier », précise de son côté OpenAI.
Dans sa volonté de rassembler le plus grand nombre d’usagers qui, éventuellement, seraient plus enclins à opter pour une formule payante, la startup met à disposition ChatGPT depuis son site Web, une application Windows, Android, iOS et macOS.
En parlant d’Apple, ChatGPT est intégré dans sa solution Apple Intelligence, sur Mac, iPad et iPhone.
Or comme la disponibilité du modèle de génération de vidéo Sora et Sora Turbo, une autre annonce du calendrier de la startup, les utilisateurs de l’Union européenne n’ont pas encore accès à Apple Intelligence.
C’est également le cas du mode « vidéo » d’Advanced Voice Mode, une fonctionnalité lancée en octobre 2024. Quand le mode voix avancé suffit pour interroger oralement GPT-4o, celui-ci permet à l’outil d’accéder à un flux vidéo à travers une capacité de vision par ordinateur et de partage d’écran… sauf en Union européenne et en France.
À lire également :
Les géants du cloud montrent les muscles
L’équipe responsable du développement des applications « Desktop » est en train de développer « Work with Apps » en s’appuyant sur les mêmes capacités, ainsi que des capacités de « screen scraping » afin de permettre aux LLM GPT-4o, o1, o1 mini et o1 pro d’interagir avec des logiciels, en commençant par les IDE, dont xcode, ceux de Jetbrains, Matlab ou encore Visual Code. En matière de bureautique, la fonctionnalité permet d’interagir avec Apple Note, Quip et Notion. Work with Apps intègre également le mode voix avancé, mais n’est pour l’instant disponible que pour macOS. La prise en charge de Windows arrivera « prochainement ».
OpenAI n’est clairement pas le seul sur ces différents terrains. Ces derniers mois, Amazon (Amazon Q), Google Cloud (Gemini pour Workspace, Agentspace, Google AI Studio), Microsoft (Copilot), Anthropic (Claude.ai), Mistral AI (Le Chat) et d’autres ont tenté de rattraper leur retard sur la startup. La firme derrière le cloud Azure et GCP semblent avoir trouvé la formule pour convertir les clients d’OpenAI.