Formale Grundlagen der Computerlinguistik: Mathematische Grundlagen
Kursbeschreibung
Studiengang | Modulkürzel | Leistungs- bewertung |
---|---|---|
BA-2010 | FF-FM | 6 LP |
NBA | FF-FM | 6 LP |
Magister | - | - |
Dozenten/-innen | Matthias Hartung |
Veranstaltungsart | Vorlesung/Übung |
Erster Termin | 22.04.2013 |
Zeit und Ort | Mo, 11:15–12:45, INF 306 / SR 14 (SR) |
Mo, 15.07.2013, INF 306 / SR 19 (SR) | |
Commitment-Frist | 20.05.–13.07.2013 |
Leistungsnachweis
- Klausur
- Übungsaufgaben
Inhalt
Die Veranstaltung vermittelt eine Einführung in die Typen formaler Sprachen sowie die mathematischen Grundlagen der symbolischen und probabilistischen Sprachmodellierung.
Zentrale Themen der Vorlesung sind im einzelnen:
- Wahrscheinlichkeitsmodelle und Estimierungsverfahren
- allgemeine Regelsprachen und Regelgrammatiken
- Chomsky-Hierarchie der formalen Sprachen
- endliche Automaten und Markov-Ketten
- Hidden Markov Models
- probabilistische kontextfreie Grammatiken
Kursübersicht
Seminarplan
Datum | Sitzung | Materialien |
22.04. | Organisatorisches, Einführung | Folien |
29.04. | Wahrscheinlichkeitstheoretische Grundbegriffe | Folien (Update: 06.05.) |
06.05. | Entropie | Folien |
13.05. | Kreuzentropie | Folien (Update: 27.05.) |
27.05. | Bedingte Wahrscheinlichkeit | Folien |
03.06. | Bayes' Theorem, Naive Bayes Classification | Folien |
10.06. | Bayesianische Graphische Modelle | Folien |
17.06. | Formale Sprachen, Allgemeine Regelgrammatik | Folien |
24.06. | Endliche Automaten | Folien |
01.07. | Reguläre Sprachen, Markov-Ketten | Folien |
08.07. | Hidden Markov Models | Folien |
15.07. | Klausur | |
22.07. | Kontextfreie Grammatiken, PCFGs, Ausblick | Folien |
Tutorien
- Dienstag, 18-20 Uhr, INF 306 SR 19 (Jasmin Schröck)
- Donnerstag, 16-18 Uhr, INF 327 SR 2 (Angela Schneider)
Fragen, Rückmeldung
...bitte über die Wiki-Seite.
Klausur
Die Abschlußklausur zu dieser Vorlesung wird am Montag, 15.07., zur gewohnten Vorlesungszeit stattfinden. Beachtet die Raumänderung (s.o.)!
Als Hilfsmittel zugelassen sind je Teilnehmer/in ein einseitig beliebig beschriebenes DIN A4-Blatt und ein Taschenrechner.
Alle Kursteilnehmer/innen, die nicht zur Klausur zugelassen sind, wurden per Mail benachrichtigt (Stand: 12.07., 14.00 Uhr).
Aufgaben
- Blatt 1 (Abgabe bis: Fr, 10.05., 23:59 Uhr)
- Blatt 2 (Abgabe bis: Do, 16.05., 23:59 Uhr), dazu: raven.txt und shannon.py
- Blatt 3 (Abgabe bis: Do, 23.05., 23:59 Uhr)
- Blatt 4 (Abgabe bis: Do, 06.06., 23:59 Uhr)
- Blatt 5 (Abgabe bis: Do, 20.06., 23:59 Uhr)
- Blatt 6 (nachträglich zum Selbststudium; Abgabe bis: Di, 09.07., 23:59 Uhr)
- Blatt 7 (Abgabe bis: Do, 04.07., 23:59 Uhr)
- Blatt 8 (Update: 05.07.; Abgabe bis: Do, 11.07., 23:59 Uhr), dazu: ab.txt
Literatur
- Bishop, C.: Pattern Recognition and Machine Learning, Springer, 2006
- Charniak, E.: Statistical Language Learning, MIT Press, 1996
- Hopcroft, J.E. and Ullman, J.D.: Introduction to Automata Theory, Languages and Computation, Addison Wesley, 1979
- Klabunde, R.: Formale Grundlagen der Linguistik, Narr, 1998
- Partee, B. et al.: Mathematical Methods in Linguistics, Kluwer, 1990
- Vossen, G. und Witt, K.-U.: Grundlagen der Theoretischen Informatik mit Anwendungen, Vieweg, 2001