Ruprecht-Karls-Universität Heidelberg
Institut für Computerlinguistik

Bilder vom Neuenheimer Feld, Heidelberg und der Universität Heidelberg

Experimente gestalten fürs Maschinelle Lernen (Exp ML)

Kursbeschreibung

Studiengang Modulkürzel Leistungs-
bewertung
BA-2010[100%|75%] CS-CL 6 LP
BA-2010[50%] BS-CL 6 LP
BA-2010[25%] BS-AC, BS-FL 4 LP
Dozenten/-innen Letitia Parcalabescu
Veranstaltungsart Proseminar
Sprache Deutsch
Erster Termin 19.10.2023
Zeit und Ort Donnerstags, 15:15-16:45, INF 325 / SR 24
Commitment-Frist tbd.

Teilnahmevoraussetzungen

Programmieren in Python

Leistungsnachweis

  • Regelmäßige und aktive Teilnahme
  • Übungsaufgaben
  • Projekt

Inhalt

Theoretische Vorkenntnisse im Bereich des maschinellen Lernens sind keine Voraussetzung. Der Schwerpunkt liegt auf der Arbeitsweise mit Daten, Evaluierung, Zielsetzung, Projektgestaltung und NICHT auf den Algorithmen.

Im ersten Teil der Veranstaltung werden anhand von zwei beispielhaften Algorithmen (Entscheidungsbäume und dem Naive Bayes Algorithmus) wichtige Konzepte für die Arbeitsweise eingeführt (Train/Dev/Test-Split, Cross-Validierung, F1-Score, etc). Dazu gibt es Übungsblätter die das Gelernte vertiefen und anwenden. Wir werden in erster Linie mit Python arbeiten, deshalb sollten Pythongkurse bereits abgeschlossen sein.

Im zweiten Teil werden wir mit der Organisation eines Experiments beginnen. Hierfür werden praktische Aufgaben zu lösen sein die auf ein kleineres Projekt hinarbeiten (in Betreuung durch die Dozentin). Das Projekt ist aus einem Anwendungsfeld der Computerlinguistik.

Seminarplan (grob)

  • Organisation, Einblick
  • Code, git, GitLab, READMEs
  • Maschinelles Lernen in einer Nussschale: (Un)überwachtes Lernen, Klassifikation, Regression
  • Entscheidungsbäume
  • Code schreiben, debuggen und dessen Ausführung beschleunigen: Multiprocessing
  • Projekt Brainstorming (Diskussionsrunde)
  • Evaluierung I: Test/Val-Devel/Test, Cross-validation, …
  • Evaluierung II: Lernkurve, Baseline, Signifikanz, Inter-annotator Agreement, …
  • Informationen relevant für Projekte, Vortrag, Referat
  • Naive Bayes
  • Wieso funktioniert Machine Learning? (Curse of Dimensionality, Manifold Hypothesis, Interpolation vs. Extrapolation, ...)
  • Projektvorstellung (Studierende)
  • GitLab Portfolio + Projektabgabe + Referat Abgabe
Materialien werden über Moodle eingestellt und verwaltet.

» weitere Kursmaterialien

zum Seitenanfang