La reconnaissance vocale sur Internet vient de passer une nouvelle étape. Le consortium W3C, en charge de normaliser le Web, vient de publier la version 1.0 des spécifications qui définissent un lexique de prononciations (Pronounciation lexicon Specifications - PLS) dans le cadre des applications en ligne liées à la reconnaissance ou à la synthèse vocale. Une étape primordiale dans l'accessibilité des sites Web aux personnes handicapées d'abord, mais également pour tout ce qui concerne les services en ligne pilotés par la voix, comme les centres d'appels ou les standards téléphoniques automatisés, dans le cadre d'applications professionnelles.
Ce projet s'intègre au coeur de l'une des grandes marottes du W3C : donner naissance à un Web universel, dont l'accès serait possible de n'importe quelle solution (mobile ou pas), par n'importe qui et dans n'importe quel environnement - un point sur lequel planche le groupe de travail dédié aux interactions multimodale. Tim Berners Lee, l'inventeur du Web, avait qualifié cette initiative de « One Web ». Avec la multiplication des téléphones portables, la voix constitue à ce titre une porte d'entrée pour nombre de services en ligne. Une évolution naturelle du Web mobile, en somme, qui est devenu un projet phare du consortium.
Développé par le groupe de travail dédié au « navigateur vocal » (Voice Browser Working group), PLS 1.0 fournit une liste de prononciations – standardisées donc - de mots ou de groupes de mots destinés à être intégrés dans les moteurs de synthèse vocale ou ceux de reconnaissance vocale. Un élément primordial pour uniformiser les façons d'articuler les termes professionnels ou encore les noms propres, explique le W3C dans la publication des spécifications. PLS s'appuie ainsi sur l'IPA (International Pronounciation Alphabet), un alphabet linguistique universel utilisé pour décrire notamment les phonèmes, les sons, les diphtongues ou triphtongues à l'écrit. Un ficher PLS (au format XML) est alors appelé en externe pour appliquer la prononciation correcte aux mots décrits par des appels SSLM (Speech Synthesis Markup Language), inclus dans VoiceXML 2.0, autre langage du W3C qui spécifie le rendu vocal aux moteurs de reconnaissance vocale (de type Text-to-speech).
« La reconnaissance vocale n’est pas encore couramment associée au « Web visuel », mais cela évoluera d'une part avec la taille sans cesse réduite des terminaux qui font que les petits claviers sont de moins en moins pratiques à utiliser, et d'autre part avec le développement des téléphones cellulaires dans des régions où le taux d’alphabétisme est bas », a expliqué James A. Larson qui co-anime le groupe de travail Navigateur vocal.
Outre l'accessibilité, c'est également en termes d'ergonomie que cette spécification devrait agir, en permettant notamment la configuration plus fine et plus localisée des services de messagerie en ligne.
Synthèse vocale : Le W3C standardise la prononciation des mots
Le 21 octobre 2008 (13:30) - par Cyrille Chausson
Rubriques : Open source - Editeurs - langages Tags : standards - web - w3c
La W3C a hissé au rang de recommandation la version 1.0 de PLS, un lexique qui formate de façon standardisée, la prononciations des mots dans le cadre d'une application en ligne. Une grand pas en avant qui vient étayer les travaux du consortium dans le domaine de la reconnaissance vocale.
livres blancs avec LesSourcesIT.fr
Démystifier les mythes sur le 10Gigabit Ethernet
Alors que le 10Gigabit Ethernet (GbE) est largement disponible depuis plusieurs, la technologie et encore nouvelle pour …
Protéger votre investissement et améliorer l’élasticité du réseau
Comment prendre en charge les évolutions imprévisibles du trafic applicatif tout en maintenant strictement les niveaux…
Les commentaires
- 1.Cray ouvre une division pour le Big Data
- 2.Les puces Xeon Haswell implémenteront la mémoire transactionnelle en 2013
- 3.Nomination : Claire Delalande devient directrice marketing de HP France
- 4.MDM : Gartner pointe du doigt les faiblesses de SAP
- 5.La France s’entraine à lutter contre la cyber-guerre
- 6.Sopra muscle ses troupes au Royaume-Uni
publicité
- 1.Free Mobile : la polémique enfle autour du réseau
- 2.TechDays 2012 : Microsoft met le paquet sur les développeurs
- 3.Enquête : quelles tendances pour l’emploi en 2012
- 4.Projet Nice du Crédit Agricole : un chantier trop vaste dans un calendrier trop serré ?
- 5.Modèle allemand : IBM pourrait se séparer de 40% de ses employés allemands d'ici 2015
- 6.IBM donne un coup d’accélérateur à sa stratégie mobilité
publicité
Les dossiers du MagIT
-
Tablettes, le temps des applications …
Les DSI peuvent-ils encore faire le gros dos face la multiplication des tablettes et autres terminaux… -
BPM : existe-t-il une place pour les pure-players ?…
Concentration des acteurs, mutation des modèles économiques, concentration du BPM dans les flux… -
La sécurité du Cloud, un défi aux multiples facettes …
À certains égards, le Cloud Computing, dans toutes ses variantes, n’est finalement qu’une option… -
Dossier : Le chiffrement parviendra-t-il à se…
Le premier semestre 2011 a été marqué par plusieurs fuites de données hautement médiatisées.…
Security Connected : Optimisez votre entreprise - Les dix grands thèmes de la sécurité que doit maîtriser tout dirigeant d'entreprise
Les entreprises sont en perpétuelle évolution. Selon une étude récente de Gartner, le rôle des directeurs informatiques évolue lui aussi : jusque-là gestionnaires des ressou…
Guide en 10 étapes pour l’achat d’une solution CRM adaptée
Le processus d'acquisition d'une solution CRM est différent de la procédure classique suivie pour les achats informatiques. Dans la mesure où la gestion de la relation client to…
livres blancs avec LesSourcesIT.fr
Recevez les newsletters du MagIT
Sans frontière










