Bilder vom Neuenheimer Feld, Heidelberg und der Universität Heidelberg

Lehrveranstaltungen
heiCO
Ressourcen	Fachschaft
Studien-FAQ	Technik-FAQ

Experimente gestalten fürs Maschinelle Lernen (Exp ML)

Kursbeschreibung

Studiengang	Modulkürzel	Leistungs- bewertung
BA-2010[100%\|75%]	CS-CL	6 LP
BA-2010[50%]	BS-CL	6 LP
BA-2010[25%]	BS-AC, BS-FL	4 LP

Dozenten/-innen	Letitia Parcalabescu
Veranstaltungsart	Proseminar
Sprache	Deutsch
Erster Termin	20.10.2022
Zeit und Ort	Donnerstags, 15:15-16:45, INF 327 / SR 2
Commitment-Frist	tbd.

Teilnahmevoraussetzungen

Programmieren in Python

Leistungsnachweis

Regelmäßige und aktive Teilnahme
Übungsaufgaben
Projekt

Inhalt

Theoretische Vorkenntnisse im Bereich des maschinellen Lernens sind keine Voraussetzung. Der Schwerpunkt liegt auf der Arbeitsweise mit Daten, Evaluierung, Zielsetzung, Projektgestaltung und NICHT auf den Algorithmen.

Im ersten Teil der Veranstaltung werden anhand von zwei beispielhaften Algorithmen (Entscheidungsbäume und dem Naive Bayes Algorithmus) wichtige Konzepte für die Arbeitsweise eingeführt (Train/Dev/Test-Split, Cross-Validierung, F1-Score, etc). Die Konzepte werden durch Übungen vertieft und gefestigt.

Im zweiten Teil werden wir mit der Organisation eines Experiments beginnen. Wir werden in erster Linie mit Python arbeiten. Hierfür werden praktische Aufgaben zu lösen sein die auf ein kleineres Projekt hinführen d.h. die Übungen sind eine Anleitung um das Projekt zu vervollständigen. Eine sorgfältige Ausarbeitung der Übungen während des Semesters bedeutet dass die Implementierung des Projektes gegen Ende der Vorlesungszeit beendet sein könnte. Das Projekt wird aus einem Anwendungsfeld der Computerlinguistik in Betreuung durch die Dozentin ausgearbeitet werden.

Seminarplan (grob)

Organisation, Einblick
Code, git, GitLab, READMEs
Maschinelles Lernen in einer Nussschale: (Un)überwachtes Lernen, Klassifikation, Regression
Entscheidungsbäume
Code schreiben, debuggen und dessen Asuführung beschleunigen: Multiprocessing
Projekt Brainstorming (Diskussionsrunde)
Evaluierung I: Test/Val-Devel/Test, Cross-validation, …
Informationen relevant für Projekte, Vortrag, Referat
Evaluierung II: Lernkurve, Baseline, Signifikanz, Inter-annotator Agreement, …
Naive Bayes
Wieso funktioniert Machine Learning? (Curse of Dimensionality, Manifold Hypothesis, Interpolation vs. Extrapolation, ...)
Projektvorstellung
GitLab Portfolio + Projektabgabe + Referat Abgabe