Distributionelle Semantik jenseits der Wortbedeutung
Studiengang | Modulkürzel | Leistungs- bewertung |
BA-2010 | AS-CL | 8 LP |
NBA | AS-CL | 8 LP |
Master | SS-CL, SS-TAC | 8 LP |
Magister | - | - |
Dozenten/-innen | Matthias Hartung |
Veranstaltungsart | Hauptseminar |
Erster Termin | 22.04.2013 |
Zeit und Ort | Mo, 09:15–10:45, INF 328 / SR 25 (SR) |
Commitment-Frist | 20.05.–13.07.2013 |
- Formale Grundlagen
- Formale Semantik
- Statistik
- Referat
- Hausarbeit
- Erwerb von "Activity Points" im Laufe des Semesters
Distributionelle Semantik ist eine aktuelle Forschungsrichtung innerhalb der Computerlinguistik und ihrer Nachbardisziplinen (Kognitionswissenschaft, Psychologie), die auf der "distributionellen Hypothese" (Harris 1951) als Grundannahme basiert. Demnach besteht ein Zusammenhang zwischen der Bedeutungsähnlichkeit linguistischer Einheiten (Wörter, Phrasen) und der Ähnlichkeit ihrer Verteilung über bestimmte sprachliche Kontexte, die aus empirischen Korpora gewonnen werden können.
Ursprünglich waren distributionelle Modelle zur Repräsentation der Bedeutung einzelner Wörter gedacht. Wir werden uns in diesem Seminar vorwiegend mit neueren Forschungsarbeiten auseinandersetzen, die untersuchen, wie die Bedeutung linguistischer Einheiten jenseits der Wortgrenzen (d.h. Phrasen, Sätze) in distributionellen Modellen erfasst werden kann. Damit bewegen sich diese Ansätze an der Schnittstelle zwischen distributioneller und formaler Semantik, an der insbesondere zwei Fragen und deren wechselseitige Bedingung von Interesse sind: Welche Bedeutungsaspekte sind zur Bedeutungsrepräsentation auf Wortebene essentiell? Welche Operatoren und Funktionen sind geeignet, um die Kompositionalität von Phrasen und Sätzen distributionell zu modellieren?
Datum | Sitzung | Referent/in | Literatur | Materialien |
22.04. | Einführung | MHa | Folien | |
29.04. | Organisatorisches, Konstituierung | Plenum | ||
06.05. | Grundlagen | MHa | Folien | |
13.05. | Structured Vectors Spaces Latent Dirichlet Allocation Singular Value Decomposition |
Franziska Chen Benjamin |
Erk & Pado (2008, 2009) Steyvers & Griffiths (2007) Martin & Berry (2007) |
Folien Folien Folien |
20.05. | fällt aus (Pfingsten) | |||
27.05. | Kontextualisierung von Vektorrepräsentationen | Lyuba Eric |
Thater et al. (2010, 2011) van de Cruys et al. (2011) |
Folien Folien |
03.06. | Multi-Prototype Models Reguläre Polysemie |
Patrick Christoph |
Reisinger & Mooney (2010) Boleda et al. (2012a) |
Folien Folien |
10.06. | Vector Mixture Models | Madeline | Mitchell & Lapata (2009, 2010) | Folien |
17.06. | Funktionale Applikation | Joachim | Baroni et al. (ms.; Kap. 3.1.1-3.5) | Folien |
24.06. | Kategorialgrammatik Compositional Matrix Space Models |
Mengfei Michael |
Clark (ms.) Rudolph & Giesbrecht (2010) |
Folien Folien |
01.07. | Higher Order Modification Adverbklassifikation (kurz) |
Damian Joachim |
Boleda et al. (2012b) |
08.07. | ausgefallen (Krankheit) | |||
15.07. | Entailment Intensionalität (kurz) Adjektiv-Modifikation (kurz) |
Dustin MadelineDamian |
Baroni et al. (2012) Boleda et al. (2013) Baroni & Zamparelli (2010) |
Folien |
22.07. | Multimodalität Text-Image Relatedness (kurz) Abschlußbesprechung |
Eric Michael Plenum |
Silberer & Lapata (2012) Leong & Mihalcea (2011) |
Folien |
Zusätzliche Materialien
- Video Lecture zu Topic Models
- Benjamin Heinzerlings Demo zu Rank Correlation Coefficients
