Sémantique : après l'échec du Web, place au poste de travail et au CMS 

Le 17 novembre 2009 (09:57) - par Cyrille Chausson

Imprimer Envoyer par e-mail

Rubriques : Poste de travail - Open source - Linux - Editeurs - Web 2.0 - Outils de développement Tags : linux - poste-travail - web - semantique - mandriva - w3c

En ce mois de novembre 2009, les technologies du sémantique ont trouvé de nouveaux havres de paix auprès du poste de travail et des outils de gestion de contenu. En premier lieu chez Mandriva qui, en poussant Mandriva 2010 sur le marché, ouvre le poste de travail sémantique aux yeux de tous. Puis auprès du projet de moteur sémantique pour CMS, IKS. Deux nouvelles approches qui doivent aider à faire passer la pilule de l'échec du Web sémantique.

En ce mois de novembre 2009, le sémantique monte d'un cran. Alors que les technologies sémantiques tardent à livrer leur véritable valeur sur le Web, en dépit d'un soutien constant de Tim Berners-Lee, patron du W3C, elles viennent de trouver une porte de sortie dans deux segments où, finalement, on ne les attendait pas : le poste de travail et les plates-formes de gestion de contenu (CMS - Content Management System).

C'est Mandriva, l'éditeur de la distribution Linux éponyme , qui a ouvert le feu le premier ce 4 novembre. L'éditeur, en sortant la version 2010 de son OS pour poste de travail, libère une partie de travaux qui germaient depuis 3 ans. Le projet de poste de travail sémantique Nepomuk -  du moins certaines briques -  atterrit enfin sur le desktop de monsieur tout le monde. Et prend pour nom de fonction Smart Desktop. Son concept ? Proposer un décloisonnement des applications en les reliant par les technologies sémantiques et en regroupant les données et les informations par tâche. L'utilisateur ne se concentre que sur l'utile et non plus sur le moyen d'accéder à une information. Mandriva parle de "task oriented desktop".

"La tendance est à la multiplication des canaux de communications et des messageries," explique Arnaud Laprévote, directeur R&D de Mandriva. "Alors que le nombre de sources de données a considérablement augmenté, suivi par l'accroissement des capacités des disques durs, l'ensemble des informations est éclaté. Et la seule personne qui fait aujourd'hui le lien, c'est encore l'utilisateur", résume-t-il, tout en ajoutant que les interfaces utilisateurs ont de leur côté peu évolué fondamentalement pour prendre à bras le corps ce problème. "Les applications sont toujours aussi isolées les unes des autres, sans partager autre chose que le presse papier. La technologie qui peut alors casser ce principe repose sur le sémantique".

Dans le détail, Smart Desktop repose sur une base de données RDF commune à chaque application, au sein de laquelle des informations vont pouvoir être déposées. Des liens sont ainsi créés entre les tâches par le biais d'ontologies, un mécanisme qui décrit les logiques entre ces mêmes informations. Le module Tasktop a la charge de créer les liens entre les informations sur le desktop. C'est le projet Scribo qui apporte là Nepomuk sa capacité à traiter le langage naturel. Faisant l'objet d'un convention avec le pôle System@tic depuis l'été dernier et profitant d'un financement de 4,3 M€, le projet Scribo vise à notamment à la création de services d'extraction d'ontologies à parti de documents. Parmi les acteurs du projet Scribo, on compte Mandriva, Nuxeo, Proxem, Tagmatica, Xwiki, l'Inria, le CEA LIST, l'Epita et l'AFP.

Si, pour l'heure, Arnaud Laprévote affirme qu'il ne s'agit que d'un prototype qui propose un système d'étiquettage (tags), il est clair qu'au regard de la traversée du désert des technologies sémantiques sur le Web, Smart Desktop contribue toutefois à donner un coup de projecteur sur un usage du sémantique. 

Deuxième projet d'envergure autour du sémantique qui voit le jour en novembre,  IKS (Interactive Knowledge Stack), un projet de moteur sémantique pour CMS (Content Management System, système de gestion de contenus) financé par l'Union européenne pour 4 ans à hauteur de 6 M€. Réunis pour son premier séminaire les 12 et 13 novembre à Rome, les 6 partenaires académiques et les 6 industriels associés au projet comptent donner aux technologies sémantiques leurs lettres de noblesse sur le terrain de la gestion de contenu. "ll s'agit de créer des extensions sémantiques pour compléter les CMS existants quelque soit la technologie utilisée. En clair, IKS représente un moteur sémantique accessible par REST (Representational State Tranfert - les données sont accessibles par un URI) qui peut s'appliquer à tous les langages, explique Bertrand Delacrétaz, développeur senior du groupe R&D de Day Software, société suisse spécialisée dans la gestion de contenu sémantique - et membre du projet.  Il donne l'exemple d'un gestionnaire de media numérique qui à l'ajout d'une image, afficherait une série d'images similaires. Avec pour objectif de davantage contextualiser l'information, d'extraire des entités du contenu et de les relier de façon beaucoup plus précises.

Si Mandriva et le projet IKS semblent faire un peu éclore le sémantique, on est encore loin du compte dans la découverte de la puissance des technologies sémantiques, semblent-ils s'accorder à dire. "Trop peu connu pour déclencher des demandes chez les clients", explique Bertrand Delacrétaz.

Pourtant, les technologies qui motorisent le concept sont normalisées et donc matures. Le W3C, par exemple, a scellé un socle technologique adéquate en standardisant RDF (Resource Description Framework), XML, OWL (Web Ontology langage)  - ce dernier permet de décrire les liaisons logiques entre informations. Malgré cela, "le mot sémantique représente un échec surtout sur le Web", constate Bertrand Delacrétaz. "Ca fait longtemps qu'on en parle sans trop de résultats". Et d'ajouter que "pour décoller, les technologies sémantiques ont besoin de cas d'utilisateur concrets". Ces deux initiatives pourraient bien donner le coup d'envoi.

livres blancs avec LesSourcesIT.fr

Guide en 10 étapes pour l’achat d’une solution CRM adaptée

Le processus d'acquisition d'une solution CRM est différent de la procédure classique suivie pour les achats informati…


Démystifier les mythes sur le 10Gigabit Ethernet

Alors que le 10Gigabit Ethernet (GbE) est largement disponible depuis plusieurs, la technologie et encore nouvelle pour …

vues 1825 lectures commentaire 4 commentaire(s) recommandation notez cet article
4

Réagissez à cet article

Votre Pseudo

Commentaire

Pertinence du commentaire : 5
Par sfermigier
 Le 17/11/2009 à 15:03
Salut Cyrille,

J'ai du mal à entendre parler d'échec du web sémantique alors que tout le monde, y compris Nathalie Kusciosko-Morizet ou JB Roger, sans parler de l'administration Obama aux US, parle de LOD (Linked Open Data) depuis 1 an, avec déjà des réalisations spectaculaires.

Pour le reste, Nuxeo a bien avancé sur les projets Scribo comme sur IKS. Nous avons des jolies démos en perspective et une intégration dans nos produits en 2010.

S.
Noter ce commentaire
Pertinence du commentaire : 0
Par Jean Rohmer
 Le 17/11/2009 à 17:25
Mais il faut tout de même rester lucide sur le Web Sémantique. Ca fait 8 ans -une éternité sur le Web- que ça décolle demain. Où est l'erreur?
Pour en sourire un peu:

http://plexus-logos-calx.blogspot.com/2009/11/a0042-petit-soulier-semantique.html

http://plexus-logos-calx.blogspot.com/2009/11/a0032.html
Noter ce commentaire
Pertinence du commentaire : 5
Par Bertrand Delacrétaz
 Le 18/11/2009 à 10:51
Merci Cyrille pour cet article! Mon nom de famille prend un Z à la fin, mais en Suisse romande on ne le prononce pas ;-)

Autre précision, Day Software (http://www.day.com) n'est pas spécialisée dans les infrastructures sémantiques, nous fournissons des produits de gestion de contenu et de gestion de média numériques de haut niveau, mais sans utiliser pour le moment d'infrastructure sémantique à proprement parler.

Nous comptons sur les retombées du projet IKS pour avancer dans cette direction, mais comme dit dans l'interview la sémantique reste un moyen d'améliorer nos produits, pas un but en soi.

La sémantique "sous le capot" oui, la sémantique "dans la figure", non ;-)
Noter ce commentaire
Pertinence du commentaire : 0
Par xbouquin
 Le 15/07/2010 à 17:56
Bonjour à tous,

Notre techno date de 10 ans, a obtenue le prix de la recherche "Claude Alègre". Pourtant l'Europe va dépenser 6M d'euros pour tenter de faire la même chose...

Voilà le travail réalisé à 2 personnes qui tourne sur un PC à la maison!
La démo possède 2 bases de sémantique. Une sémantique apprise avec 800 000 articles en Français, et une autre base apprise avec 2.500 000 articles en anglais.

Avec une infra structure correcte et en développant la propagation dans le système de logique combinatoire organique, nous pourrions obtenir des résultats encore plus impressionnants. Mais avant que le projet Quaero arrive à faire ça il va passer des octets sur Internet...

Exemple de requête avec "ours" sur la base Fr.
http://www.marvinbot.com/index.php?textboxsearch=ours&think=Explore&modepage=10&lang=fr


Pour plus d'infos le site: http://blog.marvinbot.com
Noter ce commentaire
publicité
publicité
Les dossiers du MagIT

Justifier la sécurité informatique - Gérer les risques et garantir la sécurité de votre réseau


L'objectif d'un programme de sécurité est de choisir et de déployer des contre-mesures performantes pour atténuer les vulnérabilités qui risquent très probablement de causer…

Security Connected : Optimisez votre entreprise - Les dix grands thèmes de la sécurité que doit maîtriser tout dirigeant d'entreprise


Les entreprises sont en perpétuelle évolution. Selon une étude récente de Gartner, le rôle des directeurs informatiques évolue lui aussi : jusque-là gestionnaires des ressou…
livres blancs avec LesSourcesIT.fr
Recevez les newsletters du MagIT
L'essentiel IT : L'actu IT au quotidien
événements

Etat du monde IT 2011

1 2 3 4 5   
Click Here