Le W3C publie les recommandations VoiceXML 2.0 et Grammaire de Reconnaissance de la Parole
Le W3C publie les recommandations VoiceXML 2.0 et Grammaire de
Reconnaissance de la Parole
Finalisation des composantes centrales de la plate-forme Interface
Vocale du W3C
Ressources Web :
—————
Ce communiqué :
en français : http://www.w3.org/2004/03/voicexml2-pressrelease.html.fr
en anglais : http://www.w3.org/2004/03/voicexml2-pressrelease.html.en
en japonais : http://www.w3.org/2004/03/voicexml2-pressrelease.html.ja
Témoignages de soutien d’Aspect Communications, Comverse, Genesys, HP,
IBM, Loquendo, Microsoft, Motorola, Nuance, Openstream, ScanSoft,
TellMe, Vocalocity, VoiceGenie, Voxeo, and Voxpilot:
http://www.w3.org/2004/03/voicexml2-testimonial
Recommandation SRGS :
http://www.w3.org/TR/2004/REC-speech-grammar-20040316/
Recommandation VoiceXML 2.0 :
http://www.w3.org/TR/2004/REC-voicexml20-20040316/
http://www.w3.org/ — 16 mars 2004 — Le Consortium World Wide Web (W3C)
donne de la voix sur le Web avec la publication du langage VoiceXML 2.0
et de la spécification Grammaire de Reconnaissance de la Parole (Speech
Recognition Grammar Specification – SRGS) en recommandations W3C.
L’objectif de VoiceXML 2.0 est de faciliter l’utilisation des techniques
de développement Web pour la mise en place d’applications vocales
interactives. SGRS, spécification clé pour la reconnaissance vocale en
complément de VoiceXML, est utilisée par les développeurs pour décrire
les choix possibles des utilisateurs en réponse à des annonces vocales.
VoiceXML 2.0 et SGRS sont les deux premières spécifications au stade de
recommandation W3C de la plate-forme Interface Vocale (W3C’s Speech
Interface Framework). Avec un nombre de lignes téléphoniques et de
téléphones portables estimé à plus d’un milliard dans le monde entier,
cette plate-forme va permettre à un nombre considérable de personnes de
pouvoir accéder à des services Web – interactions de type clavier
téléphonique, commandes vocales, annonces préenregistrées, voix et
musiques synthétisées – à partir de n’importe quel téléphone.
« La finalisation de VoiceXML 2.0 et de SRGS marque une étape
passionnante dans la convergence des technologies des télécommunications
et le Web. Historiquement, il existait un fossé à la fois technique et
culturel entre l’évolution des systèmes fondés sur la voix et ceux du
Web et de l’Internet, laissant l’information disponible soit par le
biais de systèmes vocaux, soit par le Web, » explique Tim Berners-Lee,
directeur du W3C. « Avec le développement de la plate-forme Interface
Vocale du W3C, dont VoiceXML 2.0 et SRGS font partie, nous sommes
maintenant capables d’intégrer et de bénéficier des forces de ces deux
domaines : la puissance et l’impact de la recherche industrielle, le
déploiement et les tests de produits à grande échelle, l’extensibilité
et l’ouverture de solutions techniques cohérentes avec les principes du
Web, ces solutions pouvant alors croître de manière exponentielle. »
Le statut de Recommandation W3C, équivalent à un standard Web, indique
que le document est stable, et qu’il contribue à l’interopérabilité du
Web. Il a été revu et approuvé par les membres W3C qui préconisent une
large adoption par l’industrie. Les recommandations W3C favorisent
l’interopérabilité des technologies du Web, grâce aux consensus obtenus
par le groupe de travail concerné.
VoiceXML 2.0 et SRGS forment les briques de bases de la plate-forme
Interface Vocale du W3C
Dans le cadre de la plate-forme Interface Vocale du W3C, VoiceXML
contrôle les interactions entre une application et un utilisateur,
tandis que le Langage de Synthèse Vocale (Speech Synthesis Markup
Language – SSML) est utilisé pour générer des annonces vocales
synthétiques. Quant à la spécification Grammaire de Reconnaissance de la
Parole (Speech Recognition Grammar Specification – SRGS), elle guide la
reconnaissance en utilisant la description des réponses possibles de
l’utilisateur. La spécification Contrôle d’Appel de Navigateur Vocal
(Voice Browser Call Control – CCXML) décrit le contrôle d’appels
téléphoniques, par exemple le transfert d’appel, pour VoiceXML ou autres
systèmes d’interaction vocale. Enfin, l’Interprétation Sémantique pour
la Reconnaissance de la Parole (Semantic Interpretation for Speech
Recognition) définit la syntaxe et la sémantique des balises dans SGRS.
VoiceXML 2.0 apporte voix et interactivité au sein de la plate-forme
Interface Vocale du W3C
VoiceXML 2.0 permet aux développeurs de créer des dialogues vocaux
utilisant des voix synthétisées, des sons numérisés, de la
reconnaissance de parole et de sons DTMF (ou Fréquences Vocales), des
messages enregistrés, des communications téléphoniques, ainsi que
différents modes de dialogues initiés par le serveur ou l’utilisateur.
VoiceXML est téléchargé à partir de serveurs HTTP, tout comme HTML. Cela
veut dire que les développeurs d’application pourront tirer profit de
technologies Web largement déployées et utilisées par le monde industriel.
« VoiceXML 2.0 modifie la manière dont sont développés les services et
informations de téléphonie. Nous n’aurons plus à appuyer sur les touches
clavier de notre téléphone, car nous serons capables, avec la parole, de
réaliser des sélections et d’envoyer des informations, » explique Dave
Raggett, responsable de l’activité Navigateur Vocal (Voice Browser) du
W3C . « De plus, VoiceXML 2.0 est adapté pour les personnes malvoyantes,
ou pour les personnes qui ont besoin d’accéder au Web dans des
situations qui ne permettent pas de se servir d’un clavier ou un écran.
Un exemple est le fait de pouvoir accéder, tout en conduisant, à un
service Web d’aide à la navigation routière. »
SRGS permet une reconnaissance efficace des réponses utilisateurs
La spécification Grammaire de Reconnaissance de la Parole (SGRS) guide
la reconnaissance en apportant la description des réponses possibles,
permettant ainsi une reconnaissance efficace des interactions de
n’importe quel utilisateur.
SRGS gère à la fois la parole et les touches DTMF. La prise en compte
des touches DTMF est très utile dans des environnements bruyants ou
quand il est gênant de parler. Les outils de reconnaissance vocale sont
généralement capables de donner de fidèles résultats, c’est à dire la
possibilité de reconnaître correctement un mot ou une phrase, et peuvent
fournir d’autres choix probables lorsque l’outil n’est pas certain de ce
qu’a prononcé l’interlocuteur.
SRGS peut également interpréter d’autres formats que la parole, et il
est ainsi capable de reconnaître parfaitement l’écriture manuscrite dès
que l’utilisateur emploie un ensemble de mots bien définis à l’avance.
Adoption notable de VoiceXML 2.0 et de SRGS dans le monde industriel
L’avancement de tout document W3C au stade de Recommandation doit être
justifié par l’existence d’au moins deux implémentations interopérables
et indépendantes : il doit être prouvé que les spécifications sont
opérationnelles. Dans le cas de VoiceXML 2.0, ce critère est largement
dépassé puisqu’on dénombre au moins huit implémentations connues, à la
fois au sein de prototypes et de produits disponibles sur le marché. Une
liste complète de ces implémentations est disponible. Quant à SGRS, son
rapport d’implémentation comporte six implémentations indépendantes et
complètes de la spécification.
VoiceXML 2.0 dispose d’une importante collection de tests publique, dont
le nombre devrait dépasser 600 dans sa version finale (la première
version en comportait 300). Elle complète la collection de tests de la
spécification Grammaire de Reconnaissance de la Parole et la collection
de tests du Langage de Synthèse Vocale devenue recommandation candidate
en décembre 2003. Les suites de tests relatives aux autres
spécifications faisant partie de la plate-forme Interface Vocale, comme
l’Interprétation Sémantique pour la Reconnaissance de la Parole et
CCXML, sont en cours de développement au sein du groupe de travail
Navigateur Vocal, et seront publiées dans les prochains mois.
Le groupe de travail Navigateur Vocal du W3C doit donc continuer à
travailler sur les spécifications restantes de la plate-forme Interface
Vocal, mais il a aussi pour tâche d’écrire les prérequis d’une prochaine
version majeure du langage qui se base sur le succès de VoiceXML 2.0 et
qui incorpore les spécifications émergeantes liées à la voix, telles que
SALT, XHTML+Voice et autres contributions des Membres W3C.
Ce groupe de travail est l’un des plus importants et des plus actifs au
sein du W3C. Il est composé des membres W3C suivants : Aspect
Communications ; BeVocal Inc. ; Canon ; Comverse Technology ; Convedia ;
ERCIM ; France Telecom ; HeyAnita ; Hitachi ; HP ; IBM ; Intel ; IWA-HWG
; Loquendo ; Microsoft ; MITRE ; Mitsubishi Electric ; Motorola ;
Nuance Communications ; Openstream ; SAP ; Scansoft ; Siemens ;
Snowshore Networks ; Sun Microsystems ; Telera ; Tellme Networks ;
Verscape ; VoiceGenie Technologies ; Voxeo et Voxpilot.
—-
Témoignages de soutien pour les recommandations VoiceXML 2.0 et SRGS
Aspect Communications | Comverse | Genesys Telecommunications
Laboratories | HP | IBM | Loquendo | Microsoft Corporation | Motorola |
Nuance | Openstream, Inc. | ScanSoft | TellMe | Vocalocity | VoiceGenie
| Voxeo | Voxpilot
Aspect Communications is committed to open, standards-based contact
center solutions. We believe VoiceXML 2.0 can contribute to the renewed
market interest in Interactive Voice Response solutions and speech
applications. By integrating VoiceXML 2.0 into both its traditional and
next-generation IVR platforms, Aspect is offering its customers
increased flexibility, portability, and investment protection.
— James Barnett, Chief Architect, Customer Self-Service Products,
Aspect Communications
As a key participant on the W3C Voice Browser Working Group and a
longtime supporter of open standards, Comverse is pleased to contribute
to and endorse VoiceXML 2.0 and the Speech Recognition Grammar
Specification as W3C Recommendations. The ratification of these
standards allows Comverse to quickly and simply interchange speech
recognition technologies in order to provide its customers with the best
language recognition performance in each of the 100+ countries in which
it does business. Comverse’s vision for total communication is a
borderless world where people are free to communicate in the way that is
most appropriate and convenient for them. VoiceXML 2.0 and SRGS are
major steps forward in realizing this goal.
— Andy Wulff, Chief Technology Officer, Comverse Americas
Genesys is a long time supporter of VoiceXML, and is delighted that
VoiceXML 2.0 has reached W3C recommendation status. As the world leader
in open standards-based voice platforms, Genesys is committed to support
VoiceXML and believes that open standards are the future for telephony
and speech applications. This milestone is a key measurement in
continuing the industry’s evolution toward open standards-based
technologies. Genesys looks forward to continuing its support of future
advances in VoiceXML.
— Paul Segre, Chief Technology Officer, Genesys Telecommunications
Laboratories, Inc.
HP congratulates the W3C Voice Browser Working Group and the interactive
media industry on reaching the VoiceXML 2.0 Recommendation. The
completion of the very first open standard for voice services is a
significant milestone in the telecommunications as well as Internet
industries. Network and service providers are moving away from
cumbersome, proprietary technologies and relying more on modular,
standards-based solutions for the speed and flexibility they need to
serve customer demand. Through our OpenCall Media Platform, HP enables
customers to reduce cost and simplify change using VoiceXML in a
carrier-grade environment.
— Ed Verney, Director of Interactive Media Platforms, HP
VoiceXML 2.0, which has been key in the growth of speech applications by
providing a standards-based framework, allows businesses to deploy
applications today that leverage existing development skills and
resources. Because it allows speech deployments to be built over a
standard web-application infrastructure, VoiceXML also provides a clear
upgrade path as applications grow – unlike closed, proprietary
languages. VoiceXML forms the foundation for IBM’s voice middleware,
including WebSphere Voice Server and WebSphere Voice Application Access.
By committing to open standards, we provide a clear path to future
upgrades that leverage existing skills, allowing enterprises to extend
their infrastructure. This commitment, and the W3C’s work, is driving us
toward the next phase of speech interaction and in the near future,
multimodality.
— Igor Jablokov, Program Director, IBM Pervasive Computing, IBM
As a leading player in speech technologies and voice platforms, Loquendo
believes that VoiceXML 2.0 and SRGS 1.0 Recommendations are an essential
step forward in promoting the speech application market. Indeed, it will
boost the speech market, by enabling service providers, content
creators, operators and voice portals to deliver a much richer user
experience.Loquendo high-quality, high-performance technologies and
platforms power over 2,000,000 calls every day in the telecommunications
and enterprise markets throughout the world and guarantee solutions in
15 languages. Loquendo is very pleased to contribute to the development
of this specification, and will continue to give a strong support to W3C
and VoiceXML Forum activities.
— Daniele Sereno, Vice President Product Engineering, Loquendo
W3C Speech Interface Framework is crucial to Microsoft’s vision of
making speech mainstream. We have implemented SRGS, SSML and SI into
Microsoft Speech Server 2004 that integrates speech into HTML through
SALT. Such a seamless integration with HTML has enabled our customers to
extend their existing investments from desktop to multimodal and
telephony voice access in a single, cost effective step. Microsoft
Speech Server also provides development tools in the popular Visual
Studio .NET environment, paving the way for Speech Interface Framework
to be adopted by the mainstream Web developers. Today’s recommendation
on SRGS is indeed an exciting first step.
— Xuedong Huang, General Manager, Speech Technologies Group, Microsoft
Corporation
Motorola strongly supports VoiceXML 2.0 and commends the W3C Voice
Browser Working Group for its efforts in developing this specification
and bringing it to Recommendation status. VoiceXML greatly simplifies
the process of creating and deploying voice services and is undergoing
broad adoption across the industry for a wide range of applications. In
the future, VoiceXML will provide the basis of multimodal-enabled
services, combining the benefits of voice with visual and
pen/stylus-based interaction to further simply and enrich information
services delivered to wireless devices.
— Mark Randolph, Director of Technology Planning and Commercialization,
Motorola Labs
Since hundreds of our customers have already deployed speech solutions
using VoiceXML, Nuance appreciates its ability to make speech
application development simpler and less costly. We are very pleased
with the World Wide Web Consortium’s (W3C) decision to advance VoiceXML
2.0 to official recommendation status. The standardization of VoiceXML
2.0 will meet a real market need for open speech standards and
accelerate the adoption of speech technologies worldwide.
— John Shea, Vice President of Product Marketing and Management, Nuance
Openstream offers multimodal solutions based on its carrier-grade Smart
Messaging Platform. The Platform implements both VoiceXML 2.0 as well as
the XHTML+VoiceXML (X+V) to support multimodal interaction. Openstream
believes VoiceXML is an important standard and is proud to be part of
the W3C-led effort to ensure the standard can be implemented ultimately
in real world multimodal solutions.
— Raj Tumuluri, President, Openstream Inc
ScanSoft congratulates the W3C Voice Browser Working Group on reaching
the Recommendation milestone for VoiceXML 2.0. It is clear that these
developing standards are integral to the development of advanced
technologies that change the way we communicate, from interactive voice
response solutions to in-vehicle automotive applications. Businesses and
consumers alike will benefit from the VoiceXML-based speech-enabled
applications. ScanSoft is committed to VoiceXML and the W3C processes
for standardization. Our SpeechWorks Family of ASR, TTS, and dialog
solutions are uniquely optimized to support VoiceXML 2.0 and enable our
partners to deliver industry-leading platforms, solutions,and services
that are revolutionizing the business of speech.
— Steve Chambers, Senior Vice President and General Manager Network,
Speech Solutions, ScanSoft
VoiceXML 2.0, built on the Web foundation of HTML and JavaScript, is
rapidly transforming the proprietary telephone network to an open
architecture. While just having reached recommendation status today,
more than 1 in 10 people in the United States have already called a
VoiceXML application; by next year the number will increase to 1 in 4.
As the universal mark-up language for the phone, VoiceXML uses Web data
and voice recognition to deliver personalization to callers, low-cost
phone sites for enterprises and new services for consumers. The
combination of voice-over-IP and VoiceXML will unleash the creativity
and pace of the Web to transform the telecommunications industry to an
entirely open standards-based network.
— Brad Porter, Director of Engineering, Tellme Networks Co-Editor,
VoiceXML 2.0
Five years ago, we launched the VoiceXML Forum with the goals of making
voice applications easier to develop and less expensive to deploy by
leveraging existing internet standards and infrastructure. Today, as
VoiceXML 2.0 becomes a W3C Recommendation, we see widespread adoption of
the new standard, sparking a level of innovation in applications never
before seen in telephony. At Vocalocity, we have designed and deployed a
highly customizable and extensible software platform that would not have
been possible without standards like VoiceXML 2.0. As a result, our OEM
and System Integrator customers enjoy lower costs and more efficient use
of their resources.
— Ken Rehor, Chief Architect, Vocalocity; Co-Editor, VoiceXML 2.0; and
Member of Founding Team, VoiceXML Forum
VoiceGenie Technologies is delighted that the VoiceXML 2.0 Specification
has achieved full W3C Recommendation status, and applauds the diligence
of the contributors to this effort. As a participant in the W3C Voice
Browser and Multimodal Interaction Working Groups, and as a board member
of the VoiceXML Forum, VoiceGenie remains strongly commited to the
support of open standards such as VoiceXML 2.0, SRGS and SSML. The
VoiceGenie framework provides complete support for VoiceXML 2.0 and
integrates a selection of industry-leading ASR and TTS resources.
World-class customers including AT&T, Verizon, Oracle, Scotiabank and
hundreds of others have selected the VoiceGenie framework for critical
applications including customer care, directory assistance automation,
retail services, voice activated dialing and more. VoiceGenie fully
supports the work of the W3C and the VoiceXML Forum, and looks forward
to continued rapid growth in the deployment of applications based on the
open standards delivered to industry by the W3C.
— Stuart Berkowitz, President and CEO, VoiceGenie Technologies.
The release of the W3C VoiceXML 2.0 specification is another significant
milestone in the explosive growth of VoiceXML. Prior to VoiceXML,
Interactive Voice Response (IVR) platforms were proprietary IT islands –
disconnected from mainstream IT infrastructure. VoiceXML and the W3C
CCXML standard efforts bring IVR into the world of modern, integrated IT
solutions. As a result of this progress, over 200 enterprise customers
have already replaced proprietary IVR platforms with Voxeo VoiceCenter
VoiceXML and CCXML platforms and hosting services.
— Jonathan Taylor, President and CEO, Voxeo Corporation
Voxpilot is delighted that the VoiceXML 2.0 specification has reached
W3C Recommendation, thereby establishing it as the industry standard
language for the delivery of Web-based content and applications via the
world’s telephones. VoiceXML 2.0 is a key technology in Voxpilot’s
product suite. By integrating the Voxpilot VoiceXML browser, any
telephony or media platform can be enhanced to support an open standard
Web model for IVR delivery. The Voxpilot Telecom Solution enables any
operator to become a voice service provider, as proved recently by
Swisscom and Monaco Telecom. As an active member of the W3C Voice
Browser Working Group, Voxpilot has made a significant contribution to
the standardization of VoiceXML and continues its support for future
evolutions of the specification.
— Dr. Dave Burke, CTO, Voxpilot Ltd.
A propos du Consortium World Wide Web (W3C)
Le Consortium World Wide Web (W3C) a été créé pour mener le Web à son
plein potentiel en développant des protocoles communs qui facilitent son
évolution et assurent son interopérabilité. C’est un consortium
industriel international, piloté conjointement par le Groupement
Européen de Recherche en Informatique et en Mathématiques (ERCIM) basé
en France, l’Université de Keio au Japon, et le Laboratoire
d’Informatique et d’Intelligence Artificielle du MIT (MIT CSAIL) aux
Etats-Unis. Les services fournis par le Consortium se composent de : la
constitution et la mise à disposition d’informations concernant le World
Wide Web à destination des développeurs et des utilisateurs ; la mise en
oeuvre de logiciels permettant d’incorporer et de promouvoir les
standards ; la mise en place de diverses applications prototypes visant
à démontrer l’utilisation des nouvelles technologies. Aujourd’hui, le
Consortium compte près de 400 Membres. Pour plus d’informations sur le
Consortium World Wide Web, consulter l’adresse suivante :
http://www.w3.org/.
Contacts Presse :
Amériques et Australie — Janet Daly, , +1.617.253.5884 ou
+1.617.253.2613
Asie — Yasuyuki Hirakawa , +81 466 49 1170
Europe — Marie-Claire Forgue, , +33 4 92 38 75 94