Spracherkennung
[01.05.2009]
Der Versuch, Computern die Erkennung der menschlichen Sprache beizubringen, ist nicht neu. Doch mittlerweile sind die Ergebnisse erstaunlich gut.
Vor wenigen Jahren waren die Versuche, die menschliche Stimme zu erkennen und daraus automatisiert sinnvolle Aktionen abzuleiten, im besten Fall erheiternd, im schlimmsten Fall völlig unbrauchbar. Dies hat sich mittlerweile jedoch stark geändert und es finden sich immer mehr sinnvolle Anwendungen.
Vermutlich hat jeder schon einmal Spracherkennung bei der Steuerung eines Telefoncomputers erlebt (“Wenn Sie Fragen zu Ihrer Rechnung haben, sagen oder drücken Sie ‘3’...”) - hier handelt es sich um eine im Grunde sehr einfache Anwendung, denn es gibt nur wenige gesprochene Kommandos, die ausgewertet werden müssen. Problematisch ist allerdings, dass die Erkennung hier ohne vorherige Informationen über den Sprecher und ohne spezielles Training erfolgen muss - die Berlinerin soll genauso erkannt werden wie der Niederbayer, der Vorarlberger ebenso wie die zugewanderte Südamerikanerin mit dem reizenden Akzent. Die sprecherunabhängige Erkennung ist entsprechend herausfordernd.
Die Chancen stehen zudem gut, dass Ihr Handy mittlerweise die Funktion der Sprachwahl und ggf. sogar der erweiterten Sprachsteuerung fest eingebaut hat: In diesem Fall reicht es, den Namen des gewünschten Gesprächspartners nach Umschaltung in den Sprachwahl-Modus so zu sprechen, wie er im Telefonbuch des Handys hinterlegt ist. Alternativ kann man häufig frei gewählte Sprachmuster hinterlegen, falls sich Namen zu ähnlich sind oder der eigentliche Name nicht erkannt wird. Hier beschränkt die Anzahl der Einträge im Telefonspeicher die möglichen Treffer, zudem kann man viele Handys auf das eigene Ausspracheverhalten trainieren - womit die Erkennungsleistung verbessert werden kann, aber zugleich sprecherabhängig wird.
Auch einige Navigationssysteme bieten mittlerweile eine Sprachsteuerung an. Da Navigationssysteme im Idealfall während der Fahrt ohne Zuhilfenahme der Hände bedient werden sollten, ist diese Entwicklung durchaus begrüßenswert. Allerdings ergibt sich hier gerade bei der Eingabe von Zieladressen eine besondere Herausforderung: Die Eingabe ist nicht mehr auf wenige Kommandos beschränkt und um eine korrekte Zuordnung zu gewährleisten, ist häufig eine spezielle Reihenfolge (z.B. PLZ/Ort, dann Straße, dann Hausnummer) mit jeweils separater Bestätigung erforderlich, damit eine Adresse korrekt zugeordnet werden kann. Ansonsten kann es schon mal Probleme geben, ob nun die Kölner Straße in Berlin oder die Berliner Straße in Köln anzusteuern ist. Hinzu kommen zwei weitere Herausforderungen, die es zu meistern gilt: Ortsnamen und Straßenbezeichnungen sind häufig nicht eindeutig (“Kölner Str 12”, “Kölner 12”, Kölnerstraße 12”, “Kölnerweg 12”) und die Erkennung soll möglichst auch während der Fahrt, also bei hohen und wechselnden Umgebungsgeräuschen, zuverlässig erfolgen.
Wiederum eine ganz andere Anwendungsklasse stellen Diktatsysteme dar: Moderne PCs sind in Kombination mit Programmen wie Dragon NaturallySpeaking 10 Wireless von Nuance nach einer kurzen Trainingsphase sehr zuverlässig in der Lage, in ein spezielles Headset gesprochene Sprache in geschriebenen Text umzuwandelt. Waren solche Lösungen vor Kurzem noch nur für spezielle Branchen (wie Mediziner und Juristen) mit speziellem Fachvokabular brauchbar, so sind moderne Spracherkennungslösungen mittlerweile alltagstauglich. Umgewöhnen muss sich der Nutzer allerdings, da er (zumindest nach derzeitigem Stand der Technik für die deutsche Sprache Satzzeichen komplett mitdiktieren muss - für US-amerikanische Sprachmodelle stehen mittlerweile Lösungen bereit, die die Kommasetzung selbsttätig übernehmen.
Ein Vorteil solcher Diktatsysteme: Sie machen keine Rechtschreibfehler - da die Wörter aus einem Wörterbuch entnommen und ggf. zusammengesetzt werden, ist die Schreibweise stets korrekt. Allerdings bedeutet das auch, dass Erkennungsfehler zu ganz anderen Wörtern führen können - und dann rasch sinnentstellend und irritierend wirken. Die aktuellen Programmversionen lassen sich allerdings nach kurzer Einarbeitungszeit effektiv nutzen und können anhand bestehender Dokumente und E-Mails an das eigene Vokabular angepasst werden. Auch ist es möglich, jederzeit neue Begriffe aufzunehmen. Für Personen, die viele Texte erfassen oder ihre E-Mail-Kommunikation effektiver gestalten möchten, können solche Systeme die eigene Produktivität maßgeblich steigern.
Programme wie Dragon NaturallySpeaking erlauben zudem die Steuerung der Windows-Oberfläche und einzelner Programme über Sprachkommandos. Diese Option ist bei Weitem nicht so effizient wie die Steuerung mit Maus und Tastatur durch einen geübten Nutzer, kann aber in Einzelfällen durchaus Sinn machen.
Abzugrenzen ist die Spracherkennung von der Sprechererkennung oder auch Stimmerkennung: Dabei handelt es sich um ein biometrisches Verfahren zur Identifikation von Personen anhand eines Sprechmusters. Bekannt sind diese Methoden vor allem aus Kinofilmen - und dort wird dann auch häufig gleich eine Methode mitgeliefert, solche Systeme zu täuschen - man benötigt nur eine Aufnahme des Sprachmusters, das man beliebig unabhängig vom ursprünglichen Sprecher abspielen kann.

ÖPWZ-Seminartipps
ÖPWZ-Einkäufer-Akademie (Aufbaukurs), Bad Ischl, Referenten-Team
16. September 2010RFID im Praxiseinsatz, Graz, Dipl.-Ing. Alexander Gauby
23.-24. September 2010So erreichen Einkäufer noch mehr in der (Preis)-Verhandlung, Wien, Dipl. oec. Volker Brodbeck
Geschenktipps
Aus unserem Archiv
Messekalender
IFA, Berlin03.09.2010 - 08.09.2010
MOTEK, Stuttgart13.09.2010 - 16.09.2010
IAA Nutzfahrzeuge, Hannover23.09.2010 - 30.09.2010
IAA Nutzfahrzeuge, Hannover23.09.2010 - 30.09.2010
ergänzende Infos + weitere Termine...
Buchtipps

Claudia E. Enkelmann
Menschen begeistern, auf andere anziehend wirken, bessere Chancen im Beruf, ein erfülltes Privatleben ...


Steve Shipside
“Kommunikation ist Management”, so die These von Steve Shipside. Die Grundlagen dafür finden Sie in diesem kompakten Büchlein.

12 Schlüssel zur Gelassenheit, Sabine Asgodom

Die 150 besten Checklisten für das Büromanagement, Claudia Behrens-Schneider, Sibylle May

Fachwörterbuch Einkauf, Prof. Dr. Helmut Wannenwetsch
mehr Buchtipps...
