Ruprecht-Karls-Universität Heidelberg
Institut für Computerlinguistik

Bilder vom Neuenheimer Feld, Heidelberg und der Universität Heidelberg

Experimente gestalten fürs Maschinelle Lernen (Exp ML)

Kursbeschreibung

Studiengang Modulkürzel Leistungs-
bewertung
BA-2010[100%|75%] CS-CL 6 LP
BA-2010[50%] BS-CL 6 LP
BA-2010[25%] BS-AC, BS-FL 4 LP
Dozenten/-innen Letitia Parcalabescu
Veranstaltungsart Proseminar
Sprache Deutsch
Erster Termin 20.10.2022
Zeit und Ort Donnerstags, 15:15-16:45, INF 327 / SR 2
Commitment-Frist tbd.

Teilnahmevoraussetzungen

Programmieren in Python

Leistungsnachweis

  • Regelmäßige und aktive Teilnahme
  • Übungsaufgaben
  • Projekt

Inhalt

Theoretische Vorkenntnisse im Bereich des maschinellen Lernens sind keine Voraussetzung. Der Schwerpunkt liegt auf der Arbeitsweise mit Daten, Evaluierung, Zielsetzung, Projektgestaltung und NICHT auf den Algorithmen.

Im ersten Teil der Veranstaltung werden anhand von zwei beispielhaften Algorithmen (Entscheidungsbäume und dem Naive Bayes Algorithmus) wichtige Konzepte für die Arbeitsweise eingeführt (Train/Dev/Test-Split, Cross-Validierung, F1-Score, etc). Die Konzepte werden durch Übungen vertieft und gefestigt.

Im zweiten Teil werden wir mit der Organisation eines Experiments beginnen. Wir werden in erster Linie mit Python arbeiten. Hierfür werden praktische Aufgaben zu lösen sein die auf ein kleineres Projekt hinführen d.h. die Übungen sind eine Anleitung um das Projekt zu vervollständigen. Eine sorgfältige Ausarbeitung der Übungen während des Semesters bedeutet dass die Implementierung des Projektes gegen Ende der Vorlesungszeit beendet sein könnte. Das Projekt wird aus einem Anwendungsfeld der Computerlinguistik in Betreuung durch die Dozentin ausgearbeitet werden.

Seminarplan (grob)

  • Organisation, Einblick
  • Code, git, GitLab, READMEs
  • Maschinelles Lernen in einer Nussschale: (Un)überwachtes Lernen, Klassifikation, Regression
  • Entscheidungsbäume
  • Code schreiben, debuggen und dessen Asuführung beschleunigen: Multiprocessing
  • Projekt Brainstorming (Diskussionsrunde)
  • Evaluierung I: Test/Val-Devel/Test, Cross-validation, …
  • Informationen relevant für Projekte, Vortrag, Referat
  • Evaluierung II: Lernkurve, Baseline, Signifikanz, Inter-annotator Agreement, …
  • Naive Bayes
  • Wieso funktioniert Machine Learning? (Curse of Dimensionality, Manifold Hypothesis, Interpolation vs. Extrapolation, ...)
  • Projektvorstellung
  • GitLab Portfolio + Projektabgabe + Referat Abgabe
Materialien werden über Moodle eingestellt und verwaltet.

» weitere Kursmaterialien

zum Seitenanfang