Statistisches Parsing
Kursbeschreibung
Studiengang | Modulkürzel | Leistungs- bewertung |
---|---|---|
BA-2010 | AS-CL | 8LP |
NBA | AS-CL | 8 LP |
Master | SS-CL, SS-TAC | 8 LP |
Magister | - | - |
Dozenten/-innen | Yannick Versley |
Veranstaltungsart | Hauptseminar |
Erster Termin | 21.10.2013 |
Zeit und Ort | Mo, 14:15–15:45, INF 327 / SR 3 (SR) |
Commitment-Frist | 02.12.2013 – 17.01.2014 |
Teilnahmevoraussetzungen
Grundlagen der Wahrscheinlichkeitstheorie und Linearen Algebra, z.B. aus Mathematischem Grundkurs oder Statistical Methods
Leistungsnachweis
Aktive Teilnahme an den Diskussionen, Referat und schriftliche Ausarbeitung
Inhalt
Text besteht aus mehr als einer Aneinanderreihung einzelner Wörter. Auf der Satzebene besteht der erste Schritt zur weitergehenden Analyse eines Textes in der Identifikation der syntaktischen Struktur (Parsing). Dieses Hauptseminar befasst sich mit dem algorithmischen Unterbau, der dazu notwendig ist, um zum einen aus einem syntaktisch annotierten Korpus (Baumbank) ein statistisches Modell der Satzstruktur zu gewinnen, und zum anderen ein solches Modell effizient anzuwenden, um plausible syntaktische Analysen für unbekannte Sätze zu finden.
Das Seminar soll dabei einen Bogen schlagen zwischen frühen Ansätzen für das Konstituentenparsing mit Baumbankgrammatiken (Charniak 1996) und neueren Ansätzen, die größere Teile der Struktur berücksichtigen (Petrov et al. 2006, Huang 2008).
Kursübersicht
Seminarplan
Datum | Sitzung | Vortragende/r |
21.10.2013 | Einführung, Organisation | Yannick Versley |
28.10.2013 | Baumbankgrammatiken I |
Danny Rehl (Charniak, 1996) Yannick Versley (Klein und Manning, 2003a) |
4.11.2013 | Baumbankgrammatiken II | David Grimm
(Schiehlen
2004) Chen Li (Dubey 2005) Ergänzend: Beispiele aus dem Negra-Corpus |
11.11.2013 | Kopflexikalisierung | Leseempfehlung: Michael
Collins zu Kopflexikalisierung Yannick Versley (Collins 2003) |
18.11.2013 | Such-Heuristiken | Frank Marczewski (Klein und Manning 2003b) |
25.11.2013 | Reranking I | Madeline Remse (Charniak und Johnson, 2005) |
2.12.2013 | Latente Variablen | Thomas Wangler (Petrov et al. 2006) |
9.12.2013 | Reranking II | Mareike Hartmann (Huang 2008) |
16.12.2013 | Self-Training | Franziska Hartmann (McClosky et al. 2006; McClosky et al. 2008) |
Weihnachten/Neujahr | ||
13.01.2013 | Parserkombination I | Angela Schneider (Sagae und Lavie 2006; Fossum und Knight 2009) |
20.1.2013 | Parserkombination II |
Chen Li (Petrov 2010) |
27.1.2013 | Parserkombination III | Lesegruppe (Le Roux et al. 2013, Huang et al. 2010) |
3.2.2013 | Abschluss | Zusammenfassung, Organisation |
Literatur
Zur Vorbereitung:
- Manning und Schütze (1999). Probabilistic Context Free Grammars . Kapittel 11 (bis 11.2)
- Manning und Schütze (1999). Probabilistic Parsing . Kapitel 12 (bis 12.1.5)
Weitere Literatur auf Anfrage bzw. zu Vorlesungsbeginn.