Formale Grundlagen der Computerlinguistik: Mathematische Grundlagen
Kursbeschreibung
Studiengang | Modulkürzel | Leistungs- bewertung |
---|---|---|
BA-2010 | FF-FM | 6 LP |
NBA | FF-FM | 6 LP |
ABA | B05 | 4 LP |
Magister | - | - |
Dozenten/-innen | Matthias Hartung |
Veranstaltungsart | Vorlesung/Übung |
Erster Termin | 21.04.2011 |
Zeit und Ort | Do, 14:15–15:45, INF 306 / SR 13 (SR) |
Teilnahmevoraussetzungen
In der Vorlesung werden grundlegende Konzepte der Wahrscheinlichkeitstheorie vorausgesetzt, die im Vorkurs "Statistik und Informationstheorie" eingeführt werden. Der Besuch dieses Vorkurses wird daher allen Teilnehmern dringend empfohlen.
Leistungsnachweis
- Klausur
- Übungsaufgaben
Inhalt
Die Veranstaltung vermittelt eine Einführung in die Typen formaler Sprachen sowie die mathematischen Grundlagen der symbolischen und probabilistischen Sprachmodellierung.
Zentrale Themen der Vorlesung sind im einzelnen:
- Wahrscheinlichkeitsmodelle und Estimierungsverfahren
- allgemeine Regelsprachen und Regelgrammatiken
- Chomsky-Hierarchie der formalen Sprachen
- endliche Automaten und Markov-Ketten
- Hidden Markov Models
- probabilistische kontextfreie Grammatiken
Kursübersicht
Seminarplan
Datum | Sitzung | Materialien |
21.04. | Organisatorisches; Wahrscheinlichkeitsbegriff, Estimierungsverfahren | Folien |
28.04. | Entropie | Folien (Update: 02.05.) |
05.05. | Bedingte Wahrscheinlichkeit | Folien |
12.05. | Formale Sprachen | Folien |
19.05. | Allgemeine Regelgrammatiken; Chomsky-Hierarchie | Folien (Update: 26.05.) |
26.05. | Reguläre Sprachen; Endliche Automaten | Folien |
09.06. | Nicht-Regularität; Probabilistische Automaten | Folien |
16.06. | Hidden Markov Models | Folien |
30.06. | HMM-Training; Kontextfreie Grammatiken | Folien |
07.07. | Probabilistische kontextfreie Grammatiken; Kontextsensitive Sprachen | Folien |
14.07. | Fragestunde, Wiederholung | |
21.07. | Klausur |
Aufgaben
Lösungen sind bis zum jeweils angebenen Abgabeschluß entweder per Mail an fgdl@cl... oder auf Papier in den dafür eingerichteten Briefkasten (INF 325, 1.OG, neben Zi. 121) abzugeben.
- Blatt 1 (Abgabe bis: Do, 05.05., 23:59 Uhr), dazu: shannon.py, raven.txt
- Blatt 2 (Abgabe bis: Do, 12.05., 23:59 Uhr)
- Blatt 3 (Abgabe bis: Do, 19.05., 23:59 Uhr)
- Blatt 4 (Abgabe bis: Do, 26.05., 23:59 Uhr)
- Blatt 5 (Abgabe bis: Fr, 03.06., 23:59 Uhr)
- Blatt 6 (Abgabe bis: Do, 16.06., 23:59 Uhr -- verlängert bis: Mi, 22.06., 23:59 Uhr), dazu: ab.txt
- Blatt 7 (Abgabe bis: Fr, 08.07., 23:59 Uhr)
- Blatt 8 (Abgabe bis: Do, 14.07., 23:59 Uhr)
Klausur
Die Klausur ist inzwischen korrigiert; die Ergebnisse werden Euch in Kürze via LSF mitgeteilt. Wer Interesse an einer Klausureinsicht hat, möge sich zur Terminabsprache bitte per Mail bei mir melden.
Literatur
- Charniak, E.: Statistical Language Learning, MIT Press, 1996
- Hopcroft, J.E. and Ullmann, J.D.: Introduction to Automata Theory, Languages and Computation, Addison Wesley, 1979
- Klabunde, R.: Formale Grundlagen der Linguistik, Narr, 1998
- Partee, B. et al.: Mathematical Methods in Linguistics, Kluwer, 1990
- Vossen, G. und Witt, K.-U.: Grundlagen der Theoretischen Informatik mit Anwendungen, Vieweg, 2001