Experimente gestalten fürs Maschinelle Lernen (Exp ML)
Kursbeschreibung
Studiengang | Modulkürzel | Leistungs- bewertung |
---|---|---|
BA-2010[100%|75%] | CS-CL | 6 LP |
BA-2010[50%] | BS-CL | 6 LP |
BA-2010[25%] | BS-AC, BS-FL | 4 LP |
Dozenten/-innen | Letitia Parcalabescu |
Veranstaltungsart |
|
Sprache | Deutsch |
Erster Termin | 20.10.2022 |
Zeit und Ort | Donnerstags, 15:15-16:45, INF 327 / SR 2 |
Commitment-Frist | tbd. |
Teilnahmevoraussetzungen
Programmieren in Python
Leistungsnachweis
- Regelmäßige und aktive Teilnahme
- Übungsaufgaben
- Projekt
Inhalt
Theoretische Vorkenntnisse im Bereich des maschinellen Lernens sind keine Voraussetzung. Der Schwerpunkt liegt
auf der Arbeitsweise mit Daten, Evaluierung, Zielsetzung, Projektgestaltung und NICHT auf den Algorithmen.
Im ersten Teil der Veranstaltung werden anhand von zwei beispielhaften Algorithmen (Entscheidungsbäume und dem
Naive Bayes Algorithmus) wichtige Konzepte für die Arbeitsweise eingeführt (Train/Dev/Test-Split,
Cross-Validierung, F1-Score, etc). Die Konzepte werden durch Übungen vertieft und gefestigt.
Im zweiten Teil werden wir mit der Organisation eines Experiments beginnen. Wir werden in erster Linie mit
Python arbeiten. Hierfür werden praktische Aufgaben zu lösen sein die auf ein kleineres Projekt hinführen
d.h. die Übungen sind eine Anleitung um das Projekt zu vervollständigen. Eine sorgfältige Ausarbeitung
der Übungen während des Semesters bedeutet dass die Implementierung des Projektes gegen Ende der Vorlesungszeit
beendet sein könnte.
Das Projekt wird aus
einem Anwendungsfeld der Computerlinguistik in Betreuung durch die Dozentin ausgearbeitet werden.
Seminarplan (grob)
- Organisation, Einblick
- Code, git, GitLab, READMEs
- Maschinelles Lernen in einer Nussschale: (Un)überwachtes Lernen, Klassifikation, Regression
- Entscheidungsbäume
- Code schreiben, debuggen und dessen Asuführung beschleunigen: Multiprocessing
- Projekt Brainstorming (Diskussionsrunde)
- Evaluierung I: Test/Val-Devel/Test, Cross-validation, …
- Informationen relevant für Projekte, Vortrag, Referat
- Evaluierung II: Lernkurve, Baseline, Signifikanz, Inter-annotator Agreement, …
- Naive Bayes
- Wieso funktioniert Machine Learning? (Curse of Dimensionality, Manifold Hypothesis, Interpolation vs. Extrapolation, ...)
- Projektvorstellung
- GitLab Portfolio + Projektabgabe + Referat Abgabe