Ruprecht-Karls-Universität Heidelberg
Institut für Computerlinguistik

Bilder vom Neuenheimer Feld, Heidelberg und der Universität Heidelberg

Kontrolle und Korrektur von MT-Output

Kursbeschreibung

Studiengang Modulkürzel Leistungs-
bewertung
BA-2010 AS-FL 8 LP
BA-2010[100%|75%]* CS-CL 6 LP
BA-2010[50%]* BS-CL 6 LP
Master SS-CL, SS-FAL 8 LP
* nach Absprache mit dem Dozenten
Dozenten/-innen Kurt Eberle
Veranstaltungsart Proseminar/Hauptseminar
Sprache Deutsch
Erster Termin 09.10.2023
Letzter Termin 13.10.2023
Zeit und Ort 09:15-14:30 Uhr
INF 327, SR5
Commitment-Frist tbd.

Teilnahmevoraussetzungen

  • Einführung CL
  • Grundkenntnisse zu Maschineller Übersetzung (Grundarchitekturen früher und heute)

Leistungsnachweis

Vortrag und/oder Klausur

Moodle-Seite

Inhalt

In dem Seminar sollen Möglichkeiten vorgestellt und diskutiert werden, den Output eines MT-Systems qualitativ einzuschätzen und bei Bedarf zu verbessern. Dabei wird es um grammatische und stilistische Kontrolle gehen, um das Einbeziehen passender (Domänen-spezischer) Terminologien, um möglichst effizientes Postediting, das versucht, manuelle Korrektur möglichst ergonomisch zu gestalten und auf ein Minimum zu begrenzen, was bedeutet, wo dies möglich ist, grammatisches und Formulierungswissen dynamisch und automatisch einzubeziehen - insbesondere durch Automatisches Lernen an Korrekturen.

In diesem Zusammenhang wird es auch um verschiedenartige Corpora für MT gehen, insbesondere um Postediting-Archive und Translation Memories, und auch um sprachliches Regelwissen: vor allem zur grammatischen Korrektheit und zur Diskurskonsistenz (Stichwort 'Anaphernresolution im satzübergreifenden Kontext' und dergleichen mehr).

Nach einer allgemeinen Einführung zur Thematik und zu den im Fokus stehenden Aspekten sollen passende Arbeiten aus der Forschung und Entwicklung referiert und diskutiert werden.

Das Seminar kann als Fortsetzung des gleichnamigen Seminars im letzten Jahr gesehen werden, es kann aber auch als Einzelveranstaltung besucht werden. Die Inhalte des Vorjahres sind nicht als Vorkenntnisse vorausgesetzt.

Eine (aktualisierte) Übersicht zu Sitzungsthemen und zugehöriger Literatur wird bis 4 Wochen vor Seminarbeginn bekanntgegeben.

Wer am Seminar teilnehmen möchte melde sich bitte per Email bei mir im Vorfeld.

Wer einen Vortrag halten möchte nimmt frühzeitig Kontakt mit mir auf. Interessierte können mir gerne weitere Literatur- und Vortragstitel (per Email) vorschlagen.

Kursübersicht

Seminarplan

Datum Thema Inhalt Materialien
Montag
9.15 Einführung Seminarüberblick, Motivation:

Fehlerbeispiele Architektur-bezogen

ISO-Anforderungen Post-Editing

Eberle
11.00 MT-Typen drei MT-Basisarchitekturen Eberle
13.00 MT Qualität Dimensionen, Übersicht, Fehlertypen Eberle
Dienstag
9.15 MT-Anforderungstypen Texttypen, Anspruch der Übersetzung,

Kontrollierte Sprache

Vortrag
11.00 Literaturübersetzung Vortrag
13.00 Güteabschätzung Qualitätsevaluierung allgemein Vortrag
Mittwoch MT Optimierung
Donnerstag Postediting
Freitag Postediting

Literatur

Eine (vorläufige) Liste mit möglichen Sitzungsthemen und zugeordneter Literatur kann hier heruntergeladen werden.

» weitere Kursmaterialien

Literaturübersicht (wird aktualisiert)

zum Seitenanfang