Sprachassistenten und Sprachdialogsysteme finden aktuell eine immer größere Verbreitung. Die Gestaltung von sprachbedienbaren Benutzungsschnittstellen unterscheidet sich dabei grundlegend von der Gestaltung haptisch-grafischer Benutzungsschnittstellen.

Es gibt einige Besonderheiten und grundlegende Gestaltungsmöglichkeiten der Sprachdialogsysteme. Der Fokus im Folgenden liegt dabei auf verschiedenen Sprachdialogen aus dem Automotive-Umfeld.

Die grundsätzliche Funktionsweise des Sprachdialogs gliedert sich folgendermaßen:

Funktionsweise Sprachdialog

 

Im Auto, wie auch auf dem Smartphone kann der Sprachdialog anhand der sogenannten Keyword-Activation, wie z.B. einem "Hey" gestartet werden.

Weitere Möglichkeiten im Auto sind die Push-to-talk-Taste (PTT) am Lenkrad oder ein (Short-)Press auf ein bestimmtes Icon. Beim Smartphone kann eine Aktivierung alternativ auch über einen (Long-)Press gestartet werden.

Nach dem Start des Sprachdialogsystems unterscheiden wir drei verschiedene Ansätze der Spracherkennung:

Spracherkennung

Darüber hinaus kann das Pause-Verhalten und die Dialogreaktivierung definiert werden. Gerade beim Fahren ist die automatische Pausenaktivierung, bei z.B. eingehenden Anrufen oder beim Scrollen in Listen sinnvoll. Der Dialog kann danach einfach über die zuvor genannten Möglichkeiten reaktiviert werden.

Weitere, detaillierte Informationen zum Thema Voice Bargein, Disambiguierungen und Sprachsynthese, finden Sie hier:

Download Präsentation

 

Ansprechpartner

Jana Paulick
Jana Paulick
Expert Voice User Interface Design