Sémantique : après l'échec du Web, place au poste de travail et au CMS

En ce mois de novembre 2009, les technologies du sémantique ont trouvé de nouveaux havres de paix auprès du poste de travail et des outils de gestion de contenu. En premier lieu chez Mandriva qui, en poussant Mandriva 2010 sur le marché, ouvre le poste de travail sémantique aux yeux de tous. Puis auprès du projet de moteur sémantique pour CMS, IKS. Deux nouvelles approches qui doivent aider à faire passer la pilule de l'échec du Web sémantique.

par

Cyrille Chausson, Rédacteur en Chef

Publié le: 16 nov. 2009

En ce mois de novembre 2009, le sémantique monte d'un cran. Alors que les technologies sémantiques tardent à livrer leur véritable valeur sur le Web, en dépit d'un soutien constant de Tim Berners-Lee, patron du W3C, elles viennent de trouver une porte de sortie dans deux segments où, finalement, on ne les attendait pas : le poste de travail et les plates-formes de gestion de contenu (CMS - Content Management System).

C'est Mandriva, l'éditeur de la distribution Linux éponyme , qui a ouvert le feu le premier ce 4 novembre. L'éditeur, en sortant la version 2010 de son OS pour poste de travail, libère une partie de travaux qui germaient depuis 3 ans. Le projet de poste de travail sémantique Nepomuk - du moins certaines briques - atterrit enfin sur le desktop de monsieur tout le monde. Et prend pour nom de fonction Smart Desktop. Son concept ? Proposer un décloisonnement des applications en les reliant par les technologies sémantiques et en regroupant les données et les informations par tâche. L'utilisateur ne se concentre que sur l'utile et non plus sur le moyen d'accéder à une information. Mandriva parle de "task oriented desktop".

"La tendance est à la multiplication des canaux de communications et des messageries," explique Arnaud Laprévote, directeur R&D de Mandriva. "Alors que le nombre de sources de données a considérablement augmenté, suivi par l'accroissement des capacités des disques durs, l'ensemble des informations est éclaté. Et la seule personne qui fait aujourd'hui le lien, c'est encore l'utilisateur", résume-t-il, tout en ajoutant que les interfaces utilisateurs ont de leur côté peu évolué fondamentalement pour prendre à bras le corps ce problème. "Les applications sont toujours aussi isolées les unes des autres, sans partager autre chose que le presse papier. La technologie qui peut alors casser ce principe repose sur le sémantique".

Dans le détail, Smart Desktop repose sur une base de données RDF commune à chaque application, au sein de laquelle des informations vont pouvoir être déposées. Des liens sont ainsi créés entre les tâches par le biais d'ontologies, un mécanisme qui décrit les logiques entre ces mêmes informations. Le module Tasktop a la charge de créer les liens entre les informations sur le desktop. C'est le projet Scribo qui apporte là Nepomuk sa capacité à traiter le langage naturel. Faisant l'objet d'un convention avec le pôle System@tic depuis l'été dernier et profitant d'un financement de 4,3 M€, le projet Scribo vise à notamment à la création de services d'extraction d'ontologies à parti de documents. Parmi les acteurs du projet Scribo, on compte Mandriva, Nuxeo, Proxem, Tagmatica, Xwiki, l'Inria, le CEA LIST, l'Epita et l'AFP.

Si, pour l'heure, Arnaud Laprévote affirme qu'il ne s'agit que d'un prototype qui propose un système d'étiquettage (tags), il est clair qu'au regard de la traversée du désert des technologies sémantiques sur le Web, Smart Desktop contribue toutefois à donner un coup de projecteur sur un usage du sémantique.

Deuxième projet d'envergure autour du sémantique qui voit le jour en novembre, IKS (Interactive Knowledge Stack), un projet de moteur sémantique pour CMS (Content Management System, système de gestion de contenus) financé par l'Union européenne pour 4 ans à hauteur de 6 M€. Réunis pour son premier séminaire les 12 et 13 novembre à Rome, les 6 partenaires académiques et les 6 industriels associés au projet comptent donner aux technologies sémantiques leurs lettres de noblesse sur le terrain de la gestion de contenu. "ll s'agit de créer des extensions sémantiques pour compléter les CMS existants quelque soit la technologie utilisée. En clair, IKS représente un moteur sémantique accessible par REST (Representational State Tranfert - les données sont accessibles par un URI) qui peut s'appliquer à tous les langages, explique Bertrand Delacrétaz, développeur senior du groupe R&D de Day Software, société suisse spécialisée dans la gestion de contenu sémantique - et membre du projet. Il donne l'exemple d'un gestionnaire de media numérique qui à l'ajout d'une image, afficherait une série d'images similaires. Avec pour objectif de davantage contextualiser l'information, d'extraire des entités du contenu et de les relier de façon beaucoup plus précises.

Si Mandriva et le projet IKS semblent faire un peu éclore le sémantique, on est encore loin du compte dans la découverte de la puissance des technologies sémantiques, semblent-ils s'accorder à dire. "Trop peu connu pour déclencher des demandes chez les clients", explique Bertrand Delacrétaz.

Pourtant, les technologies qui motorisent le concept sont normalisées et donc matures. Le W3C, par exemple, a scellé un socle technologique adéquate en standardisant RDF (Resource Description Framework), XML, OWL (Web Ontology langage) - ce dernier permet de décrire les liaisons logiques entre informations. Malgré cela, "le mot sémantique représente un échec surtout sur le Web", constate Bertrand Delacrétaz. "Ca fait longtemps qu'on en parle sans trop de résultats". Et d'ajouter que "pour décoller, les technologies sémantiques ont besoin de cas d'utilisateur concrets". Ces deux initiatives pourraient bien donner le coup d'envoi.

Sémantique : après l'échec du Web, place au poste de travail et au CMS

Pour approfondir sur Editeurs

Avec l’émergence de l’IA générative, Redis revoit ses priorités

Avec Modeler, Google découple la modélisation sémantique de Looker

SGBD : Progress Software finalise le rachat de MarkLogic

BI : 5 fonctions de SQL Server 2012 à connaître