Ruprecht-Karls-Universität Heidelberg
Bilder vom Neuenheimer Feld, Heidelberg und der Universität Heidelberg
Siegel der Uni Heidelberg

Spracherkennung

Kursbeschreibung

DozentInnen Markus Klehr, Carsten Günther
Veranstaltungsart Proseminar
Zeit und Ort Fr, 10:15 - 13:45, INF 325 / PCPool (SR)
Studiengang Magister, NBA, ABA
Modul-Kürzel NBA: CS-CL, BS-CL, BS-AC; ABA: A18
Leistungsbewertung NBA: 4 LP
ABA: 4 LP

Teilnahmevoraussetzungen

Kenntnisse in Statistik und Signalverarbeitung sind von Vorteil, aber nicht erforderlich. Im Kurs werden Übungsaufgaben in VoiceXML gelöst, so dass Programmiererfahrungen (Java Script, XML) ebenfalls von Vorteil sind.

Leistungsnachweis

Ausarbeitung einer Programmieraufgabe (Sprachdialog-Modul)

Inhalt

Der Kurs wird die Grundlagen der Spracherkennung behandeln. Es werden die verschiedenen Verarbeitungsschritte der automatischen Spracherkennung behandelt: von der Signalverarbeitung bis zum Sprachmodell. Dabei wird auf aktuelle Forschungen auf diesem Gebiet eingegangen. Aber auch aktuelle Implementationen und Systeme (wie der IBM WebSphere Voice Server) sollen vorgestellt werden.
Im praktischen Teil des Seminars wird auf der Grundlage von VoiceXML ein Sprachdialogsystem implementiert. Es werden die einzelnen Schritte des Entwurfs und der Implementierung behandelt (Wizard-of-Oz Test, Dialogmodell, Grammatikentwurf, Prompt-Design, Test). Es werden dabei die verschiedenen Einflussfaktoren wie Vokabulargröße oder Grammatikkomplexität auf das Erkennungsergebnis untersucht.

Kursübersicht

Seminarplan

Datum Sitzung Materialien

Literatur

  • C. Günther, M. Klehr: VoiceXML 2.0, mitp 2003
  • F. Jelinek: Statistical Methods for Speech Recognition, MIT Press 1997
  • E. G. Schukat-Talamazzini: Automatische Spracherkennung, Vieweg 1995
  • B. Eppinger, E. Herter: Sprachverarbeitung, Hanser 1993

» weitere Kursmaterialien