Definition

Watson (IBM)

Watson est un supercalculateur développé par IBM, qui combine intelligence artificielle (IA) et solutions analytiques évoluées pour répondre de façon optimale à des questions formulées en langage naturel. Il doit son nom au fondateur d'IBM, Thomas J. Watson.

La puissance de calcul de Watson s'élève à 80 téraflops (8 000 milliards d'opérations en virgule flottante par seconde). Pour atteindre (ou dépasser) la capacité d'un être humain performant à répondre à des questions, Watson accède à 90 serveurs avec un datastore combiné de plus de 200 millions de pages d'informations, qu'il traite au moyen de six millions de règles logiques. Le volume occupé par l'ordinateur et ses données équivaut à l'espace nécessaire pour 10 réfrigérateurs.

Principaux composants de Watson :

  • frameworks Apache UIMA (Unstructured Information Management Architecture), infrastructure et autres éléments permettant l'analyse de données non structurées ;
  • Hadoop d'Apache, une infrastructure de programmation gratuite en langage Java qui prend en charge le traitement de jeux de données volumineux dans un environnement informatique distribué ;
  • SUSE Enterprise Linux Server 11, le système d'exploitation le plus rapide sur processeurs Power7 ;
  • 2 880 coeurs de processeur ;
  • 15 To de mémoire vive ;
  • 500 Go d'informations prétraitées ;
  • DeepQA d'IBM, logiciel conçu pour extraire des informations par traitement du langage naturel et apprentissage automatique.

Les applications de la technologie sous-jacente d'informatique cognitive de Watson sont presque infinies. L'ordinateur, qui peut exécuter des opérations d'exploration de texte et d'analytique complexe sur de très grands volumes de données non structurées, prend en charge un moteur de recherche ou un système expert aux capacités jamais atteintes auparavant. En mai 2016, BakerHostetler, un cabinet d'avocats centenaire de l'Ohio, a conclu un contrat portant sur un système expert juridique basé sur Watson pour assister son équipe de 50 personnes spécialisé dans les procédures de faillite. ROSS peut explorer les données d'environ un milliard de textes, analyser les informations et répondre avec précision à des questions complexes en moins de 3 secondes. Le traitement du langage naturel permet au système de traduire le jargon juridique pour répondre aux questions des avocats. Les créateurs de ROSS continuent d'ajouter des modules juridiques au système. Actuellement, des systèmes experts de même nature sont en train de révolutionner la recherche médicale.

En 2011, lors d'un tournoi promotionnel, Watson a battu deux des meilleurs joueurs de Jeopardy! (célèbre jeu télévisé américain où il faut deviner la question à partir de la réponse), Ken Jennings et Brad Rutter. L'avatar de Watson était placé entre ses deux concurrents, comme un participant humain, alors qu'un impressionnant volume de matériel se trouvait à un autre étage du bâtiment. Watson, comme ses concurrents, n'avait pas accès à Internet.

Lors d'une session de répétition, Watson a fait preuve d'une capacité égale à celle d'un être humain dans le domaine des jeux de mots complexes, par exemple en fournissant correctement la question « Qu'est-ce que Baby Ruth Ginsburg ? » correspondant à la définition « Une friandise classique qui est aussi une juge de la Cour suprême ». Selon Brad Rutter, si l'extraction des informations est une opération simple pour Watson et difficile pour un humain, l'humain reste le meilleur pour la tâche complexe de compréhension. Néanmoins, l'apprentissage automatique permet à Watson de comparer ses erreurs aux réponses correctes pour savoir où il s'est trompé et améliorer ses réponses futures. 

Dans une interview réalisée pendant la session de répétition de Jeopardy!, un représentant d'IBM a éludé la question portant sur l'éventuel accès à Watson via une interface Web. Il a botté en touche en déclarant qu'IBM regardait plutôt du côté des applications verticales, comme la santé et l'aide à la décision.

Cette définition a été mise à jour en avril 2018

Pour approfondir sur Intelligence Artificielle et Data Science

Close