Ruprecht-Karls-Universität Heidelberg
Bilder vom Neuenheimer Feld, Heidelberg und der Universität Heidelberg
Siegel der Uni Heidelberg

Informationsextraktion

Kursbeschreibung

DozentMatthias Hartung
VeranstaltungsartVorlesung
ZeitDonnerstag, 11:15-12:45 Uhr
OrtIm Neuenheimer Feld 325, SR 7
StudiengangABA, NBA, Magister
Modul-KürzelNBA: CS-CL, BS-CL, BS-AC
ABA: A12
LeistungsbewertungABA: 4 ECTS-Punkte, NBA: 4 oder 6 ECTS-Punkte


Teilnahmevoraussetzungen

Programmierkenntnisse

Leistungsnachweis

  • Lektüre einschlägiger Literatur
  • Die Lösung kursbegleitender Übungsaufgaben (darunter auch kleinere Programmieraufgaben)
  • Die Lösung einer umfangreicheren Implementierungsaufgabe (in Gruppenarbeit) während der vorlesungsfreien Zeit.

Inhalt

Informationsextraktionssysteme haben zum Ziel, domänenspezifische Information aus unrestringierten Texten zu gewinnen und zu strukturieren. Es geht dabei nicht um eine vollst?ndige Inhaltsanalyse eines Textes, sondern um das gezielte Auffinden relevanter Textausschnitte und deren Analyse mithilfe robuster und effizienter computerlinguistischer Techniken. Dabei ist es die Aufgabe des Benutzers, die Muster zu spezifizieren, in denen relevante Information in Texten sprachlich realisiert wird (z.B. in Form bestimmter syntaktischer Patterns oder semantischer Relationen). In neueren Informationsextraktionssystemen wird allerdings zunehmend versucht, den Spezifikationsaufwand für den Benutzer zu reduzieren und relevante Muster mithilfe von Techniken des Maschinellen Lernens vom System selbst akquirieren zu lassen.

Wir werden uns in diesem Kurs zunächst mit den einzelnen Komponenten eines Informationsextraktionssystems befassen: lexikalische Analyse, Named Entity Recognition, Chunk-Parsing, Anaphernresolution. Maschinelle Lernverfahren werden an verschiedenen Punkten angesprochen, aber nicht vertieft. Der Kurs richtet sich in erster Linie an Bachelor-Studierende, die sich erste Einblicke in ein Anwendungsfeld der Computerlinguistik verschaffen wollen, kann aber auch von Magister-Studierenden besucht werden.

Die Leistungsanforderungen in diesem Kurs umfassen neben der Lektüre einschlägiger Literatur die Lösung kursbegleitender Übungsaufgaben (darunter auch kleinere Programmieraufgaben) sowie die Lösung einer umfangreicheren Implementierungsaufgabe (in Gruppenarbeit) während der vorlesungsfreien Zeit. Programmierkenntnisse sind daher unverzichtbare Voraussetzung für die Teilnahme.

Kursübersicht

Seminarplan

Die aktuellen Folien sind hier verfügbar!

» Kursmaterialien

zum Seitenanfang