Ruprecht-Karls-Universität Heidelberg
Institut für Computerlinguistik

Bilder vom Neuenheimer Feld, Heidelberg und der Universität Heidelberg

Designing Experiments for Machine Learning Tasks

Kursbeschreibung

Studiengang Modulkürzel Leistungs-
bewertung
BA-2010[100%|75%] CS-CL 6 LP
BA-2010[50%] BS-CL 6 LP
BA-2010[25%] BS-AC 4 LP
Dozenten/-innen Éva Mújdricza-Maydt
Veranstaltungsart Proseminar
Erster Termin 26.10.2016
Zeit und Ort Mi, 16:1517:45, INF 327 / SR 3 (SR)
Commitment-Frist tbd.

Teilnahmevoraussetzungen

Programmierkenntnisse

Leistungsnachweis

  • Regelmäßige und aktive Teilnahme
  • Übungsaufgaben (in den Sitzungen)
  • Gruppenprojekt (Gruppengröße: 2-4 Personen)

Inhalt

Die Veranstaltung dient dazu, praktische Erfahrungen in der Anwendung einfacher Verfahren des maschinellen Lernens zu erwerben. Theoretische Vorkenntnisse im Bereich des maschinellen Lernens sind hilfreich, aber keine Voraussetzung. Im ersten Teil der Veranstaltung werden zwei grundlegende Lernverfahren behandelt: Entscheidungsbäume und den Naive Bayes Algorithmus. Im zweiten Teil werden wir über die Organisation eines Experiments sprechen. Wir werden die Data-Mining-Software WEKA kennenlernen, um diese zwei Algorithmen praktisch anzuwenden. Hierfür werden praktische Aufgaben aus einem Anwendungsfeld der Computerlinguistik in Gruppenarbeit zu lösen sein.

Kursübersicht

Seminarplan

Datum Sitzung: Materialien
Theorie Übung Projekt
26.10. Organisation (26.10.), ML-Einblick (26.10. ) A01: Erwartungen, Foto-Protokoll
02.11. Überwachtes Lernen HA01: Lesen und Berichten Beispiel-Projekte, Projekt-Organisation, MM_CL-Projekt, Wiki: Projektgruppen
09.11. Entscheidungsbäume HA+: DT Wiki: Treffen
16.11. entfällt selbstorganisiertes Gruppen-Treffen
23.11. (DT Fortsetzung) A02: Attribute (1) (23.11.) Format-Beispiele (23.11.)
30.11. Weka (1) A03: Attribute (2) (30.11.) MM_Features
07.11. Programmablauf planen, Weka (Fortsetzung) Ablaufdiagramm (07.12.), HA02: Statusbericht (07.12.) Projekt-Phasen (07.12.), MM_Statusreport
14.12. Evaluierung (14.12.) A04: Weka (14.12.), cars.zip
21.12. NB HA03: Feature-Extraktion (27.12., 28.12., 02.01.) Wiki: Referatstermine
11.01. Weka (2) (10.01.), ML-Kombinationen (11.01.), (Tafelbild)
18.01. Weka (3) (18.01.) Evaluierungsbeispiel, README-Beispiel MM_Referat, README-Beispiele
25.01. Referate: ner_n2, Findet_Emo, genre_lyr Wiki: Tipps zur Gestaltung der Präsentation
01.02. Referate: senti_tw, ner_n1, senti_mr
08.02. Referate: wsd_mt, senti_rr, wsd_e2e, senti_bb

Literatur

  • Tom Mitchell: Machine Learning . McGraw-Hill, 1997.
  • Ian H. Witten - Eibe Frank - Mark A. Hall. Data Mining . Morgan Kaufman, 2011 (3. Aufl.).
  • Chris Manning and Hinrich Schütze. Foundations of Statistical Natural Language Processing . MIT Press, 1999.

» weitere Kursmaterialien

zum Seitenanfang