« IA pour tous » : Google Cloud segmente son offre
Google Cloud a présenté une série de nouveaux outils visant à faciliter l’injection de l’IA dans l’écosystème IT des entreprises. Ses offres ciblent tour à tour les métiers, les data analysts, les développeurs et les data scientists.
Lors de son Google Cloud Next '22, le géant technologique a présenté Translation Hub, un agent qui fournit aux utilisateurs une traduction de documents en libre-service ; de nouvelles fonctionnalités pour son système Document AI ; et un nouvel outil de vision par ordinateur pour la plateforme Vertex AI.
Ces produits ont pour but d’aider les clients à « accélérer la création de valeur à partir de l’IA grâce à l’écosystème Google Cloud », affirme Chirag Dekate, analyste chez Gartner.
De la traduction de langues à la reconnaissance d’images, « un grand nombre des chaînes d’outils construites dans les écosystèmes Google Cloud simplifient l’accès [à l’IA] », ajoute-t-il.
Cibler l’utilisateur final avec Translation Hub
Dave SchubmehlAnalyste, IDC
Le lancement de Translation Hub intervient après l’ajout par Google de 24 nouvelles langues à Google Translate plus tôt cette année. Dans la foulée, Translation Hub permet aux utilisateurs de traduire des documents dans environ 135 langues différentes en quelques secondes, selon Google. Les utilisateurs peuvent également faire intervenir un « humain dans la boucle ». Cette option permet à des experts locaux d’éditer et de réviser les documents traduits pour en vérifier l’exactitude.
Translation Hub se distingue des autres offres de traduction que Google a lancées dans le passé, observe Dave Schubmehl, analyste chez IDC. Parmi celles-ci, l’API de traduction du fournisseur destinée aux programmeurs et une application mobile de traduction.
« [Avec Translation Hub] Google se concentre essentiellement sur l’utilisateur final », note Dave Schubmehl. « L’offre est vraiment destinée aux métiers ».
Simplifier l’extraction de données dans des documents
Avec Document AI, Google cible davantage les développeurs et les analystes.
« L’une des choses que les gens trouvent les plus difficiles actuellement, c’est de savoir comment extraire toutes ces informations de manière précise de différents types de documents », explique Dave Schubmehl.
Avec la préversion de Document AI Workbench, Google assure qu’il est plus facile pour les organisations d’extraire des informations d’un document type PDF en fonction d’un besoin spécifique.
Les entreprises peuvent désormais extraire des champs d’intérêt. Pour cela, les utilisateurs ont accès à un environnement permettant de labéliser les documents (indiquer les valeurs que l’on souhaite extraire), et à des processeurs OCR préentraînés qu’ils peuvent ajuster pour créer leurs propres modèles d’extraction.
De ce que LeMagIT observe, un expert métier peut participer à un tel projet. Toutefois, les métriques d’évaluation de la précision du modèle fournies par Workbench sont davantage lisibles par un statisticien ou un data scientist.
En préversion, Document AI Warehouse doit permettre aux entreprises de rechercher des documents structurés ou non structurés, de créer des contrôles de workflows et d’effectuer des recherches d’entités nommées dans ces documents. Les ontologies peuvent être créées manuellement, à l’aide d’une interface de labélisation, ou automatiquement, via un modèle Document AI. Le Warehouse inclut également les métadonnées des fichiers et les vecteurs (les éléments extraits des documents) associés.
Dans l’idée, un modèle créé avec le Workbench de Document AI peut être utilisé pour traiter des documents stockés dans le Warehouse. Il est également possible d’appeler un modèle Document AI via API à la réception d’une facture ou d’un bon de livraison sous format PDF, par exemple.
Mettre la computer vision à portée de mains des développeurs
En outre, le service Vertex AI Vision illustre l’expansion des cas d’usage de la vision par ordinateur, selon Dave Schubmehl. Cette offre de computer vision à la demande rend la reconnaissance d’images accessibles à un plus grand nombre de métiers de la donnée.
Vertex AI Vision étend les capacités de Vertex AI. Vertex AI est une « plateforme » lancée en 2021 afin d’unifier les outils d’apprentissage automatique existants de Google Cloud dans un seul environnement.
Dave SchubmehlAnalyste, IDC
Selon Google, Vertex AI Vision doit aider les développeurs à réduire le temps nécessaire à la création d’applications de vision par ordinateur. La solution dispose d’une interface glisser-déposer et une bibliothèque de modèles préentraînés pour des tâches telles que la détection d’objets, le comptage de personnes ou encore la reconnaissance de produits.
À noter que Vertex AI Vision permet de créer des applications en exploitant des données extraites en temps réel de flux vidéo, ce qui facilite, entre autres, l’activation de modèles de floutage de visages.
« Ces API de vision par ordinateur à faible coût existent depuis un certain temps, mais elles n’étaient pas toujours faciles à utiliser », selon M. Schubmehl. « L’ajout par Google de ce niveau de capacité va simplement ouvrir les portes à davantage de cas d’usage sur le marché ». Le coût ne serait pas assez faible cependant. « Avec le lancement de la tarification mensuelle au deuxième trimestre 2023, Vertex AI Vision coûtera dix fois moins cher que les offres actuelles », promet GCP.
Bien que Google fournisse des modèles préentraînés, les entreprises peuvent aussi importer leurs propres algorithmes de computer vision. Ces organisations devront faire beaucoup plus d’efforts, prévient l’analyste. Elles peuvent toutefois utiliser les fonctions d’AutoML pour accélérer un tant soit peu le processus.
L’autre défi consiste à s’assurer que les modèles de vision respectent les normes responsables de l’IA et n’affichent pas les caractéristiques faciales ou les dossiers médicaux privés. En ce sens, Google a déclaré qu’il suivait ses propres directives en matière d’IA responsable pour résoudre certains de ces problèmes.
Du MLOps pour les équipes de data science
Dans une autre partie de la galaxie Vertex AI, Google Cloud a annoncé la disponibilité générale de Model Registry. Cet environnement stocke les modèles et leurs différentes variantes en sus des métadonnées associées en vue de gérer leur cycle de vie. Par ailleurs, le fournisseur améliore petit à petit son feature store, où il sera bientôt possible d’effacer des paramètres, mais surtout de les ingérer en streaming. Cela permettrait de modifier les paramètres en quelques secondes pour optimiser un traitement effectué depuis une application Web.
Ici, Google Cloud met l’accent sur le MLOps en direction des équipes de data science. La pression sur les ingénieurs augmente graduellement pour déployer des modèles IA en production.
« Tous ces éléments sont conçus pour aider les entreprises à créer un pipeline ou un portefeuille de projets afin d’accélérer la production et de bénéficier des avantages de l’IA », avance Chirag Dekate.