Arbeitsgruppe internationalisiert SSML
Die Speech Synthesis Markup Language (SSML), seit 2004 W3C-Recommendation, zielt darauf ab, eine vielseitige, XML-basierte Markup-Sprache für die Erzeugung von synthetischer Sprache in Web- und anderen Applikationen anzubieten. Die eigentliche Rolle der Markup-Sprache ist es, Autoren von sprachlich synthetisierbaren Inhalten eine standardisierte Möglichkeit zu geben, Aspekte der Wiedergabe wie Aussprache, Lautstärke, Höhe, Geschwindigkeit etc. über verschiedene, sprachsynthesefähige Plattformen hinweg zu steuern.
Diese Attribute sind kritisch wichtig, für spezifische Sprachen können aber weitere Attribute noch entscheidender sein. So hat zum Beispiel das Mandarin-Chinesische, die heute am meisten gebrauchte Sprache der Welt, auch das Konzept der Intonierung. Das selbe Schriftzeichen kann verschiedene Aussprachen und Bedeutungen haben, abhängig von der benutzten Intonierung. Angesichts der Flut von Handys in China - manche Schätzungen sprechen von mehr als einer Milliarde - ist die Bedeutung der Erweiterung von SSML für Mandarin allein aufgrund der reinen Marktrelevanz klar. Die Einbeziehung von Erweiterungen für Japanisch, Koreanisch und andere Sprachen wird sicherstellen, dass eine umfassendere Beteiligung der Welt am Web möglich wird.
Erweiterung für Sprecherverifikation wird in VoiceXML 3.0 integriert
Ein weiteres Feature, das sich die Nutzer von Telefonie-Diensten und dem Web wünschen, ist die Verifikation des Sprechers.
"Identitätsklau, Betrug, Phishing, Terrorismus, sogar schon die hohen Kosten von Passwortresets haben das Interesse am Einsatz von biometrischer Sicherheit für alle Kommunikationskanäle - einschließlich des Telefons - ansteigen lassen", sagte Ken Rehor von Vocalocity, neu gewählter Vorsitzender des VoiceXML-Forums und Teilnehmer an der W3C Voice-Browser-Arbeitsgruppe. "Sprecherverifikation und -identifikation ist nicht nur die beste Biometrie für die Sicherung von Telefontransaktionen und -kommunikation, sie kann auch nahtlos mit Spracherkennung und Sprachsynthese in VoiceXML-Anwendungen zusammenarbeiten."
Bis jetzt haben die meisten Hersteller dieses fehlende Feature dadurch kompensiert, dass sie eigene Ansätze für ihre Dienste gewählt haben. Das Resultat ist ein Satz unterschiedlicher Technologien, die untereinander nicht interoperabel sind. Dank der Anforderungen aus dem VoiceXML Forum Speaker Biometrics Committee war die W3C Voice Browser Working Group in der Lage, die benötigten Features für ein standardisiertes Sprachverifikationsmodul zu identifizieren. Die Arbeitsgruppe beginnt nun damit, diese Anforderungen zu bearbeiten.
Perfekter Zeitpunkt für neue Teilnehmer
Angesichts der Tiefe und Breite der angekündigten neuen Arbeit, aber auch der neuen Pläne für zusätzliche Funktionen für VoiceXML 3.0, ist jetzt ein perfekter Zeitpunkt für neue Firmen, Forscher und Interessierte, dem W3C beizutreten und sich an den neuesten Entwicklungen für Voice-Technologien und das Web zu beteiligen. Unter den potentiellen Mitwirkenden sind besonders jene aus dem Forschungs- und Industriebereichder Sprach- und Sprechererkennung in asiatischen Sprachen in ganz Asien kritisch wichtig, um die beste Expertise in der Entwicklung jener Standards zu ermöglichen, die wirklich den Bedürfnissen der Webnutzer weltweit dienen. Mehr Informationen zur W3C Voice Browser Activity und zur W3C Mitgliedschaft finden Sie auf der W3C Webseite.