Ruprecht-Karls-Universität Heidelberg
Institut für Computerlinguistik

Bilder vom Neuenheimer Feld, Heidelberg und der Universität Heidelberg

Formale Grundlagen der Computerlinguistik: Mathematische Grundlagen

Kursbeschreibung

Studiengang Modulkürzel Leistungs-
bewertung
BA-2010 FF-FM 6 LP
NBA FF-FM 6 LP
ABA B05 4 LP
Magister - -
Dozenten/-innen Matthias Hartung
Veranstaltungsart Vorlesung/Übung
Erster Termin 21.04.2011
Zeit und Ort Do, 14:1515:45, INF 306 / SR 13 (SR)

Teilnahmevoraussetzungen

In der Vorlesung werden grundlegende Konzepte der Wahrscheinlichkeitstheorie vorausgesetzt, die im Vorkurs "Statistik und Informationstheorie" eingeführt werden. Der Besuch dieses Vorkurses wird daher allen Teilnehmern dringend empfohlen.

Leistungsnachweis

  • Klausur
  • Übungsaufgaben

Inhalt

Die Veranstaltung vermittelt eine Einführung in die Typen formaler Sprachen sowie die mathematischen Grundlagen der symbolischen und probabilistischen Sprachmodellierung.

Zentrale Themen der Vorlesung sind im einzelnen:

  • Wahrscheinlichkeitsmodelle und Estimierungsverfahren
  • allgemeine Regelsprachen und Regelgrammatiken
  • Chomsky-Hierarchie der formalen Sprachen
  • endliche Automaten und Markov-Ketten
  • Hidden Markov Models
  • probabilistische kontextfreie Grammatiken

Kursübersicht

Seminarplan

Datum Sitzung Materialien
21.04. Organisatorisches; Wahrscheinlichkeitsbegriff, Estimierungsverfahren Folien
28.04. Entropie Folien (Update: 02.05.)
05.05. Bedingte Wahrscheinlichkeit Folien
12.05. Formale Sprachen Folien
19.05. Allgemeine Regelgrammatiken; Chomsky-Hierarchie Folien (Update: 26.05.)
26.05. Reguläre Sprachen; Endliche Automaten Folien
09.06. Nicht-Regularität; Probabilistische Automaten Folien
16.06. Hidden Markov Models Folien
30.06. HMM-Training; Kontextfreie Grammatiken Folien
07.07. Probabilistische kontextfreie Grammatiken; Kontextsensitive Sprachen Folien
14.07. Fragestunde, Wiederholung
21.07. Klausur

Aufgaben

Lösungen sind bis zum jeweils angebenen Abgabeschluß entweder per Mail an fgdl@cl... oder auf Papier in den dafür eingerichteten Briefkasten (INF 325, 1.OG, neben Zi. 121) abzugeben.

  • Blatt 1 (Abgabe bis: Do, 05.05., 23:59 Uhr), dazu: shannon.py, raven.txt
  • Blatt 2 (Abgabe bis: Do, 12.05., 23:59 Uhr)
  • Blatt 3 (Abgabe bis: Do, 19.05., 23:59 Uhr)
  • Blatt 4 (Abgabe bis: Do, 26.05., 23:59 Uhr)
  • Blatt 5 (Abgabe bis: Fr, 03.06., 23:59 Uhr)
  • Blatt 6 (Abgabe bis: Do, 16.06., 23:59 Uhr -- verlängert bis: Mi, 22.06., 23:59 Uhr), dazu: ab.txt
  • Blatt 7 (Abgabe bis: Fr, 08.07., 23:59 Uhr)
  • Blatt 8 (Abgabe bis: Do, 14.07., 23:59 Uhr)

Klausur

Die Klausur ist inzwischen korrigiert; die Ergebnisse werden Euch in Kürze via LSF mitgeteilt. Wer Interesse an einer Klausureinsicht hat, möge sich zur Terminabsprache bitte per Mail bei mir melden.

Literatur

  • Charniak, E.: Statistical Language Learning, MIT Press, 1996
  • Hopcroft, J.E. and Ullmann, J.D.: Introduction to Automata Theory, Languages and Computation, Addison Wesley, 1979
  • Klabunde, R.: Formale Grundlagen der Linguistik, Narr, 1998
  • Partee, B. et al.: Mathematical Methods in Linguistics, Kluwer, 1990
  • Vossen, G. und Witt, K.-U.: Grundlagen der Theoretischen Informatik mit Anwendungen, Vieweg, 2001

» weitere Kursmaterialien

» Tutorium

zum Seitenanfang