
Spracherkennung
Kursbeschreibung
DozentInnen | Markus Klehr, Carsten Günther |
Veranstaltungsart | Proseminar |
Zeit und Ort | Fr, 10:15 - 13:45, INF 325 / PCPool (SR) |
Studiengang | Magister, NBA, ABA |
Modul-Kürzel | NBA: CS-CL, BS-CL, BS-AC; ABA: A18 |
Leistungsbewertung | NBA: 4 LP ABA: 4 LP |
Teilnahmevoraussetzungen
Kenntnisse in Statistik und Signalverarbeitung sind von Vorteil, aber nicht erforderlich. Im Kurs werden Übungsaufgaben in VoiceXML gelöst, so dass Programmiererfahrungen (Java Script, XML) ebenfalls von Vorteil sind.
Leistungsnachweis
Ausarbeitung einer Programmieraufgabe (Sprachdialog-Modul)
Inhalt
Der Kurs wird die Grundlagen der Spracherkennung behandeln. Es werden die verschiedenen Verarbeitungsschritte der automatischen
Spracherkennung behandelt: von der Signalverarbeitung bis zum Sprachmodell. Dabei wird auf aktuelle Forschungen auf diesem
Gebiet eingegangen. Aber auch aktuelle Implementationen und Systeme (wie der IBM WebSphere Voice Server) sollen vorgestellt
werden.
Im praktischen Teil des Seminars wird auf der Grundlage von VoiceXML ein Sprachdialogsystem implementiert. Es werden die einzelnen
Schritte des Entwurfs und der Implementierung behandelt (Wizard-of-Oz Test, Dialogmodell, Grammatikentwurf, Prompt-Design,
Test). Es werden dabei die verschiedenen Einflussfaktoren wie Vokabulargröße oder Grammatikkomplexität auf das Erkennungsergebnis
untersucht.
Kursübersicht
Seminarplan
Datum | Sitzung | Materialien |
Literatur
- C. Günther, M. Klehr: VoiceXML 2.0, mitp 2003
- F. Jelinek: Statistical Methods for Speech Recognition, MIT Press 1997
- E. G. Schukat-Talamazzini: Automatische Spracherkennung, Vieweg 1995
- B. Eppinger, E. Herter: Sprachverarbeitung, Hanser 1993