Formale Grundlagen der Computerlinguistik: Mathematische Grundlagen
Kursbeschreibung
Studiengang | Modulkürzel | Leistungs- bewertung |
---|---|---|
BA-2010 | FF-FM | 6 LP |
NBA | FF-FM | 6 LP |
Magister | - | - |
Dozenten/-innen | Matthias Hartung |
Veranstaltungsart | Vorlesung/Übung |
Erster Termin | 19.04.2012 |
Zeit und Ort | Do, 14:15–15:45, INF 306 / SR 13 (SR) |
Tutorium
Termin und Ort: | Mo, 16-18, SR 24 (INF 325) |
Tutorin: | Angela Schneider |
Teilnahmevoraussetzungen
In der Vorlesung werden grundlegende Konzepte der Wahrscheinlichkeitstheorie vorausgesetzt, die in der Veranstaltung "Mathematischer Vorkurs" eingeführt werden. Der Besuch dieses Vorkurses wird daher allen Teilnehmern dringend empfohlen. Achtung: Der Mathematische Vorkurs findet bereits am Ende des vorhergehenden Wintersemesters statt: http://www.cl.uni-heidelberg.de/courses/ws11/mathevorkurs/
Leistungsnachweis
- Klausur
- Übungsaufgaben
Inhalt
Die Veranstaltung vermittelt eine Einführung in die Typen formaler Sprachen sowie die mathematischen Grundlagen der symbolischen und probabilistischen Sprachmodellierung.
Zentrale Themen der Vorlesung sind im einzelnen:
- Wahrscheinlichkeitsmodelle und Estimierungsverfahren
- allgemeine Regelsprachen und Regelgrammatiken
- Chomsky-Hierarchie der formalen Sprachen
- endliche Automaten und Markov-Ketten
- Hidden Markov Models
- probabilistische kontextfreie Grammatiken
Kursübersicht
Seminarplan
Datum | Sitzung | Materialien |
19.04. | Einführung; Elementare Wahrscheinlichkeitstheorie | Folien |
03.05. | Estimierungsverfahren; Entropie | Folien (Update: 10.05.) |
24.05. | Bayesianische Statistik | Folien |
31.05. | Graphische Modelle | Folien |
14.06. | Formale Sprachen: Allgemeine Regelgrammatik | Folien |
21.06. | Reguläre Sprachen, Endliche Automaten | Folien |
28.06. | Nicht-Regularität; Probabilistische Automaten | Folien |
05.07. | Hidden Markov Models | Folien |
12.07. | Probabilistische kontextfreie Grammatiken | Folien |
19.07. | PCFG-Training; Kontextsensitive Sprachen | Folien |
26.07. | Klausur |
Klausur
Die Klausur findet statt am Donnerstag, 26.07., 14-16 Uhr, SR 13 (INF 306). Als Hilfsmittel sind je Teilnehmer zugelassen: ein einseitig beliebig beschriebenes DIN A4-Blatt, mathematische Formelsammlung, Taschenrechner. Weitere Hilfsmittel sind nicht zugelassen.
Die angekündigten Mails zur Klausurzulassung wurden verschickt. Wer keine Mail bekommen hat, ist aufgrund zu weniger abgegebener Übungsblätter nicht zur Klausur zugelassen. Wendet Euch in Zweifelsfällen bitte an den Kursleiter.
Aufgaben
Die Abgabe der Aufgaben muss grundsätzlich vor Ablauf der angegebenen Frist erfolgen, und zwar bevorzugt per Mail an fgdl@cl...
Formatiert die Betreffzeile Eurer Mail bitte folgendermaßen: [FG] BlattX Nachname Matr.Nr.
Lösungen auf Papier können ebenefalls eingereicht werden. Auch dafür ist die Abgabefrist einzuhalten !
- Blatt 1 (Abgabe bis Freitag, 11.05., 23:59 Uhr), dazu: raven.txt und shannon.py
- Blatt 2 (Abgabe bis Donnerstag, 24.05., 23:59 Uhr)
- Blatt 3 (Abgabe bis Donnerstag, 31.05., 23:59 Uhr)
- Blatt 4 (Abgabe bis Donnerstag, 14.06., 23:59 Uhr)
- Blatt 5 (Abgabe bis Donnerstag, 21.06., 23:59 Uhr)
- Blatt 6 (Abgabe bis Donnerstag, 28.06., 23:59 Uhr)
- Blatt 7 (Abgabe bis Donnerstag, 05.07., 23:59 Uhr), dazu: ab.txt
- Blatt 8 (Abgabe bis Donnerstag, 12.07., 23:59 Uhr)
- Blatt 9 (letztes Aufgabenblatt; Abgabe bis Donnerstag, 19.07., 23:59 Uhr)
Wiki-Seite
Fragen und Unklarheiten speziell zu den Aufgaben könnt Ihr auf der Wiki-Seite zu dieser Vorlesung loswerden.
Literatur
- Bishop, C.: Pattern Recognition and Machine Learning, Springer, 2006
- Charniak, E.: Statistical Language Learning, MIT Press, 1996
- Hopcroft, J.E. and Ullmann, J.D.: Introduction to Automata Theory, Languages and Computation, Addison Wesley, 1979
- Klabunde, R.: Formale Grundlagen der Linguistik, Narr, 1998
- Partee, B. et al.: Mathematical Methods in Linguistics, Kluwer, 1990
- Russell, S. und Norvig, P.: Artificial Intelligence. A Modern Approach, Prentice Hall, 2003
- Vossen, G. und Witt, K.-U.: Grundlagen der Theoretischen Informatik mit Anwendungen, Vieweg, 2001