Ruprecht-Karls-Universität Heidelberg
Institut für Computerlinguistik

Bilder vom Neuenheimer Feld, Heidelberg und der Universität Heidelberg

Multimodale Semantik

Kursbeschreibung

Studiengang Modulkürzel Leistungs-
bewertung
BA-2010[100%|75%] CS-CL 6 LP
BA-2010[50%] BS-CL 6 LP
BA-2010[25%] BS-AC 4 LP
NBA[100%|75%] CS-CL 6 LP
NBA[50%|25%] BS-CL, BS-AC 4 LP
Magister - -
Dozenten/-innen Gerhard Kremer
Veranstaltungsart Proseminar
Erster Termin 24.10.2012
Zeit und Ort Mi, 14:1515:45, INF 329 / SR 26 (SR)
Commitment-Frist 6. Dezember 30. Januar

Teilnahmevoraussetzungen

  • Vertrautheit mit Statistik und mathematischen Grundlagen der Computerlinguistik
  • Voranmeldung bis 22.10. per E-Mail beim Dozenten

Leistungsnachweis

  • Aktive Teilnahme an den Diskussionen
  • Referat und schriftliche Ausarbeitung (Abgabe bis 25.02.)

Inhalt

Datengetriebene (vor allem distributionelle) Modelle der Wortbedeutung in der Computerlinguistik beruhten bis vor wenigen Jahren ausschließlich auf großen Textkorpora. Es gibt jedoch gute Gründe, sich nicht alleine auf Text als Wissensquelle zu stützen. Diese kommen sowohl von der kognitiven Seite (Menschen lernen Wortbedeutung selten aus Text allein, sondern Wahrnehmung spielt auch eine wichtige Rolle) als auch von der linguistischen Seite (offensichtliche Informationen wie "Gras ist grün" sind in Korpora schwer zu finden, da sie nicht informativ wären).

Eine neue Forschungsrichtung in der Computerlinguistik hat daher zum Ziel, für die Modellierung von Wortbedeutung auch Information anderer Modalitäten mit einzubeziehen, zum Beispiel menschliches Wissen über Konzept-Merkmale, Assoziationen oder visuelle Information.

Wir werden uns im Seminar mit der Erstellung, dem Umgang und Anwendungen von verschiedenen Bedeutungsrepräsentationen beschäftigen und den Methoden aus der Computerlinguistik, die dabei angewendet werden.

Kursübersicht

Seminarplan

Datum Sitzung Materialien
24.10. Einführung intro.pdf
31.10. Referatsvergabe, Bewertungskriterien
07.11. Turney & Pantel (2010):
From Frequency to Meaning: Vector Space Models of Semantics
14.11. Baroni & Lenci (2010):
Distributional Memory: A General Framework for Corpus-Based Semantics
21.11. [Julia]
Andrews, Vigliocco & Vinson (2009):
Integrating Experiential and Distributional Data to Learn Semantic Representations
28.11. Chen & Mooney (2008):
Learning to Sportscast: A Test of Grounded Language Acquisition
05.12. [Magnus]
Speriosou, Brown, Moon, Baldridge & Erk (2010):
Connecting Language and Geography With Region-Topic Models
12.12. Bergsma & Goebel (2011):
Using Visual Information to Predict Lexical Preference
19.12.
9.01. [Martina]
Farhadi, Hejrati, Sadeghi, Young, Rashtchian, Hockenmaier & Forsyth (2010):
Every Picture Tells a Story: Generating Sentences from Images
16.01. Leong & Mihalcea (2011):
Measuring the Semantic Relatedness Between Words and Images
23.01. [Amol]
Feng & Lapata (2010):
Visual Information in Semantic Representation
30.01. Bruni, Tran & Baroni (2011):
Distributional Semantics From Text and Images
06.02. Bergsma & Van Durme (2011):
Learning Bilingual Lexicons Using the Visual Similarity of Labeled Web Images
25.02. written report due

Literatur

Wird im Seminar bekanntgegeben.

» weitere Kursmaterialien

zum Seitenanfang