Multimodale Semantik
Kursbeschreibung
Studiengang | Modulkürzel | Leistungs- bewertung |
---|---|---|
BA-2010[100%|75%] | CS-CL | 6 LP |
BA-2010[50%] | BS-CL | 6 LP |
BA-2010[25%] | BS-AC | 4 LP |
NBA[100%|75%] | CS-CL | 6 LP |
NBA[50%|25%] | BS-CL, BS-AC | 4 LP |
Magister | - | - |
Dozenten/-innen | Gerhard Kremer |
Veranstaltungsart | Proseminar |
Erster Termin | 24.10.2012 |
Zeit und Ort | Mi, 14:15–15:45, INF 329 / SR 26 (SR) |
Commitment-Frist | 6. Dezember – 30. Januar |
Teilnahmevoraussetzungen
- Vertrautheit mit Statistik und mathematischen Grundlagen der Computerlinguistik
- Voranmeldung bis 22.10. per E-Mail beim Dozenten
Leistungsnachweis
- Aktive Teilnahme an den Diskussionen
- Referat und schriftliche Ausarbeitung (Abgabe bis 25.02.)
Inhalt
Datengetriebene (vor allem distributionelle) Modelle der Wortbedeutung in der Computerlinguistik beruhten bis vor wenigen Jahren ausschließlich auf großen Textkorpora. Es gibt jedoch gute Gründe, sich nicht alleine auf Text als Wissensquelle zu stützen. Diese kommen sowohl von der kognitiven Seite (Menschen lernen Wortbedeutung selten aus Text allein, sondern Wahrnehmung spielt auch eine wichtige Rolle) als auch von der linguistischen Seite (offensichtliche Informationen wie "Gras ist grün" sind in Korpora schwer zu finden, da sie nicht informativ wären).
Eine neue Forschungsrichtung in der Computerlinguistik hat daher zum Ziel, für die Modellierung von Wortbedeutung auch Information anderer Modalitäten mit einzubeziehen, zum Beispiel menschliches Wissen über Konzept-Merkmale, Assoziationen oder visuelle Information.
Wir werden uns im Seminar mit der Erstellung, dem Umgang und Anwendungen von verschiedenen Bedeutungsrepräsentationen beschäftigen und den Methoden aus der Computerlinguistik, die dabei angewendet werden.
Kursübersicht
Seminarplan
Datum | Sitzung | Materialien |
24.10. | Einführung | intro.pdf |
31.10. | Referatsvergabe, Bewertungskriterien | |
07.11. | Turney & Pantel (2010): From Frequency to Meaning: Vector Space Models of Semantics |
|
14.11. | Baroni & Lenci (2010): Distributional Memory: A General Framework for Corpus-Based Semantics |
|
21.11. | [Julia] Andrews, Vigliocco & Vinson (2009): Integrating Experiential and Distributional Data to Learn Semantic Representations |
|
28.11. |
Chen & Mooney (2008): Learning to Sportscast: A Test of Grounded Language Acquisition |
|
05.12. | [Magnus] Speriosou, Brown, Moon, Baldridge & Erk (2010): Connecting Language and Geography With Region-Topic Models |
|
12.12. |
Bergsma & Goebel (2011): Using Visual Information to Predict Lexical Preference |
|
9.01. | [Martina] Farhadi, Hejrati, Sadeghi, Young, Rashtchian, Hockenmaier & Forsyth (2010): Every Picture Tells a Story: Generating Sentences from Images |
|
16.01. |
Leong & Mihalcea (2011): Measuring the Semantic Relatedness Between Words and Images |
|
23.01. | [Amol] Feng & Lapata (2010): Visual Information in Semantic Representation |
|
30.01. |
Bruni, Tran & Baroni (2011): Distributional Semantics From Text and Images |
|
06.02. |
Bergsma & Van Durme (2011): Learning Bilingual Lexicons Using the Visual Similarity of Labeled Web Images |
|
25.02. | written report due |
Literatur
Wird im Seminar bekanntgegeben.