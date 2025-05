Alors que les rivaux de l’IA générative commencent à éroder son contrôle de longue date sur la recherche, Google a présenté mardi de nouvelles capacités à travers sa pile logicielle. Il a élargi les capacités associées à ses modèles Gemini, en commençant par les infuser dans son moteur de recherche.

« Nous sommes au stade où des décennies de recherche en IA imprègnent la réalité », a déclaré Sundar Pichai, PDG de Google, lors du keynote de Google I/O, la conférence annuelle des développeurs Android.

La refonte de son service de recherche est une décision qui semble motivée par le succès précoce de concurrents tels qu’OpenAI et Perplexity. Ces acteurs ont réussi à marquer les esprits face au géant qu'est Google.

En outre, le fournisseur infuse une version personnalisée de son modèle Gemini 2.5 dans Search, aux États-Unis. Cette fois-ci, il s'agit d'améliorer les « aperçus d’IA » (AI Overviews). Ces aperçus sont des résumés générés qui condensent les informations issues des résultats. Un résumé apparaît tout en haut de la première page affichée par le moteur après l'avoir interrogé. Ces « AI Overviews » sont dorénavant disponibles dans plus de 200 pays et territoires, a indiqué le géant du cloud. Ce service n’est pas disponible en France, mais il suffit de traverser la Manche pour le tester.

Après avoir testé le mode IA (AI Mode) dans Search en début d’année, Google s'apprête à le déployer aux États-Unis. Avec AI Mode, un LLM répond aux demandes des internautes en s'appuyant sur les résultats de recherche. Ce module apparaîtra désormais dans Search et dans l’application mobile Google. L’AI Mode intègre aussi une extension Deep Search qui doit amplifier les résultats de recherche et les enrichir.

« La vente de publicité est l’activité principale de Google », rappelle Alan Pelz-Sharpe. « C’est sa source de revenu principale, et il est donc possible qu’il prépare un modèle commercial associé ».

« Il y a une notion implicite de résumés dignes de confiance, et cela signifie également que cela permet aux entreprises de nouvelles voies de marketing et d’optimisation de la recherche », anticipe Chirag Dekate.

Outre la création d’un assistant personnel, Google a également présenté de nouveaux modèles de génération d’images et de vidéos, Veo 3 et Imagen 4. Veo 3 peut désormais générer des vidéos avec du son. Pour rappel, il avait présenté l’évolution de Veo2 et Imagen 3 lors de sa conférence annuelle Next 25, en avril. En outre, Flow est un nouvel outil de réalisation de films propulsé à l’IA qui permet aux utilisateurs de créer des scènes dignes d’un film avec Veo 3.

« Il s’agit de personnaliser cet assistant en fonction de votre contexte spécifique et du mien », comprend l’analyste. « Ces deux contextes d’exploitation peuvent se croiser, mais ils ont des contraintes et des principes d’exploitation complètement différents ».

Nouveaux outils et capacités

En ce qui concerne Gemini, Google a introduit de nouvelles capacités telles que la génération audio native et le « computer use » dans Gemini 2.5. Gemini 2.5 Pro, a le droit à un mode de raisonnement amélioré, appelé Deep Think. Celui-ci permettrait d’effectuer des tâches de calcul et de programmation complexes.

Dans le but de transformer l’application Gemini en un assistant universel, Google intègre certaines fonctionnalités du Projet Astra – telles que la compréhension des vidéos, le partage d’écran et la mémoire – dans Gemini Live, Search et l’API Live pour les développeurs. Gemini Live est une fonctionnalité de l’application Gemini qui permet aux utilisateurs d’avoir des conversations vocales naturelles avec le modèle.

Google introduit de nouvelles fonctionnalités dans Workspace, telles que la traduction vocale en temps réel dans Meet et les réponses « intelligentes » dans Gmail.