Ruprecht-Karls-Universität Heidelberg
Institut für Computerlinguistik

Bilder vom Neuenheimer Feld, Heidelberg und der Universität Heidelberg

Designing Experiments for Machine Learning Tasks

Kursbeschreibung

Studiengang Modulkürzel Leistungs-
bewertung
BA-2010[100%|75%] CS-CL 6 LP
BA-2010[50%] BS-CL 6 LP
BA-2010[25%] BS-AC (ggf. BS-FL) 4 LP
NBA[100%|75%] CS-CL 6 LP
NBA[50%|25%] BS-AC (ggf. BS-FL) 4 LP
Dozenten/-innen Éva Mújdricza-Maydt
Veranstaltungsart Proseminar
Sprache Deutsch
Erster Termin 24.10.2018
Zeit und Ort
Mittwoch, 16:15-17:45,
INF 326 / SR 27 (*)
Commitment-Frist 08.01.-20.01.2019

 

Teilnahmevoraussetzungen

ECL, Programmierkenntnisse (bevorzugt Python und/oder Java)(*)

Leistungsnachweis

  • Regelmäßige und aktive Teilnahme
  • Übungsaufgaben (in den Sitzungen)
  • Gruppenprojekt (Gruppengröße: 2-4 Personen)

Inhalt

Die Veranstaltung dient dazu, praktische Erfahrungen in der Anwendung einfacher Verfahren des maschinellen Lernens zu erwerben. Theoretische Vorkenntnisse im Bereich des maschinellen Lernens sind hilfreich, aber keine Voraussetzung. Im  ersten Teil der Veranstaltung werden zwei grundlegende Lernverfahren behandelt: Entscheidungsbäume und den Naive Bayes Algorithmus. Im zweiten Teil werden wir über die Organisation eines Experiments sprechen. Wir werden in erster Linie  die Data-Mining-Software WEKA kennenlernen, um diese zwei Algorithmen praktisch anzuwenden. Hierfür werden praktische (Präsenz)aufgaben zu lösen sein,  außerdem soll ein kleineres Projekt aus einem Anwendungsfeld der Computerlinguistik in Gruppenarbeit und in Betreuung durch die Dozentin ausgearbeitet werden.

Kursübersicht

Seminarplan


Datum
Sitzung
Theorie Übung Projekt
24.10. Organisation (20181023) ; Einblick (20181024)
31.10. Überwachtes Lernen (20181031) ; Projektorganisation (20181031) A01: Erwartungen (20181024) ; HA01: Gruppenbildung (20181031) P01: Projektorganisation (20181031); Wiki: Projektvorschläge ; MM_CL-Projekt (20141023)
07.11. Empfohlene Tätigkeit (Selbststudium): Gruppentreffen für Projektbesprechung
14.11. Entscheidungsbäume (1.Teil) (20181114) A02: Projektphasen (20181031) ; HA02: Lesen und Berichten (20181123) HA03: Treffen1, Statusbericht (20181207)
21.11. DT Fortsetzung A03: Attribute (1) (20181121)
28.11. Weka (1) (20181204) Besprechung der HA02 (kurze Einf. in gitlab)
05.12. Weka 1 Fortsetzung A04: ARFF-Beispiel (20181121) ; A05: Attribute (2) (20181121) MM: Statusbericht (20181205)
12.12. Evaluierung (20151221) A06: ARFF-Korr/Eval (20151212) ; HA04: Feature-Extraktion (20151212) Abgabetermin für den Statusbericht ; Formatbeispiele (20151212)
19.12. Evaluierung Forts.; Weka (2) (20151219) A07: Eval (20151219) ; A08: Experimenter (20151219)
09.01. (NB (20161221) ); Weitere ML-Verfahren (20190109) A08: Eval (2) (20190109)
16.01. Readme, (Bsp.: SIGF-V2.pdf) (20190116) A09: Abbildungen (20190116) Empfehlung zum Referathalten: MM: Referat (20190109) ; MM: Vortrag (20190109) Referate.pdf ; Rhetorik.pdf
23.01. Projektvorstellung:
  • Brothers of Destruction ('How Trump is this?' - Autorenerkennung in Twitter)
  • ClOli (Genre-Klassifikation von englischen Songs)
  • WuSeGi (Gender-Identifizierung in webbasierter Kommunikation)
30.01. Projektvorstellung:
  • Blockcluster (Genre-Klassifikation von Kinofilmen anhand minimaler Information)
  • MaLiNaUt (Produkt-Bewertung anhand Empfehlungsreviews)
  • MiLaKo ('Wer schaut was?' - Gender-Identifizierung und Bewertungsvorhersage bei Kinofilm-Empfehlungen)
06.02.

Literatur

  • Tom Mitchell: Machine Learning . McGraw-Hill, 2008. (Nachdruck der 1. Aufl. 1997)
  • Ian H. Witten - Eibe Frank - Mark A. Hall. - Christopher J. Pal Data Mining. Practical Machine Learning Tools and Techniques . Morgan Kaufman, 2017 (4. Aufl.). [HEIDI Online-Ausgabe: https://katalog.ub.uni-heidelberg.de/titel/68101576]
  • Chris Manning and Hinrich Schütze. Foundations of Statistical Natural Language Processing . MIT Press, 2003. (6. Aufl.)
  • Weitere Angaben während des Semesters.

» Wikiseite

» weitere Kursmaterialien

zum Seitenanfang