Ruprecht-Karls-Universität Heidelberg
Institut für Computerlinguistik

Bilder vom Neuenheimer Feld, Heidelberg und der Universität Heidelberg

Semantic Role Labeling

Kursbeschreibung

Studiengang Modulkürzel Leistungs-
bewertung
BA-2010[100%|75%] CS-CL 6 LP
BA-2010[50%] BS-CL 6 LP
BA-2010[25%] BS-AC, BS-FL 4 LP
Dozenten/-innen Éva Mújdricza-Maydt
Veranstaltungsart Proseminar
Sprache Deutsch
Erster Termin 24.04.2019
Zeit und Ort Mittwoch, 14:15-15:45, INF 327 / SR 4
Commitment-Frist 26.Juni - 18.Juli

Teilnahmevoraussetzungen

Einführung in die Computerlinguistik, Einführung in die Sprachwissenschaft oder entsprechende Kenntnisse

Leistungsnachweis

  • aktive und regelmäßige Teilnahme,
  • Referat,
  • schriftliche Ausarbeitung oder praktisches Projekt,
  • gelegentliche praktische Übungen

Inhalt

Semantic Role Labeling (SRL) beschäftigt sich mit der semantischen Satzanalyse, wobei Prädikate und ihre Argumente mit semantischen Labels ausgezeichnet werden. Dadurch erhält man die Information über das Geschehnis und seine Umstände, d.h., 'wer was mit wem wann wo und wie' in der beschriebenen Situation macht.

SRL wird auch als "shallow semantic parsing" genannt, denn nicht der ganze Satz, sondern ein Teilbereich - die Prädikat-Argument-Struktur - im Fokus der Analyse steht. Die SRL-Aufgabe ist dennoch vielfältig. Mehrere Annotationsframeworks wurden ausgearbeitet, die unterschiedliche Vor- und Nachteile mit sich bringen, und manuelle wie automatische Ansätze vor unterschiedlichen Herausforderungen stellen. Die Annotationen werden auf verschiedenen Gebieten genutzt wie z.B. bei Question-Answering, automatischer Textzusammenfassung oder Übersetzung. Die semantische Analyse kann auch in Kombination mit oder als Unterstützung von weiteren Interpretationsebenen dienen -- z.B. kann SRL mit Parsing-Strukturen zusammen gelernt werden oder bei Koreferenzresolution behilflich sein.

Klassische Ansätze zum Lernen der SRL-Strukturen basieren auf sorgfältig ausgewählten linguistisch motivierten bis statistischen Features. Neuere Methoden bis hin zu neuralen Lernarchitekturen verzichten vorwiegend auf hand-desinged Features, erfordern jedoch große Mengen an Daten. In dieser Richtung sind auch verschiedene Ansätze zum domänen- und sprachübergreifenden Lernen sowie (semi-)automatischem Projizieren der Annotation entstanden. Die neueste Forschung wiederum zeigt eine Tendenz zu sogenannten hybriden Systemen, wobei Informationen aus manuell erstellten semantischen Ressourcen als Unterstützung der datengetriebenen Lernverfahren eingesetzt werden.

Im Seminar werden die grundlegenden SRL Frameworks (FrameNet, PropBank, VerbNet), ihr Annotationsschema und Datensätze vorgestellt, klassische und moderne Forschungsansätze zu SRL, Tools und Evaluierungsmethoden im Rahmen von Referaten und kleinen praktischen Übungen kennen gelernt und diskutiert.

Kursübersicht

Seminarplan

siehe Wikiseite
Datum Sitzung Materialien

Literatur

Literatur wird am Anfang des Seminars bekanntgegeben.

» weitere Kursmaterialien

zum Seitenanfang