Ruprecht-Karls-Universität Heidelberg
Institut für Computerlinguistik

Bilder vom Neuenheimer Feld, Heidelberg und der Universität Heidelberg

Designing Experiments for Machine Learning Tasks

Kursbeschreibung

Studiengang Modulkürzel Leistungs-
bewertung
BA-2010[100%|75%] CS-CL 6 LP
BA-2010[50%] BS-CL 6 LP
BA-2010[25%] BS-AC 4 LP
NBA[100%|75%] CS-CL 6 LP
NBA[50%|25%] BS-CL, BS-AC 4 LP
Magister - -
Dozenten/-innen Éva Mújdricza-Maydt
Veranstaltungsart Proseminar
Erster Termin 21.10.2013
Zeit und Ort Mo, 14:1515:45, INF 327 / SR 4
Commitment-Frist 02.12.2013 – 17.01.2014

 

Teilnahmevoraussetzungen

Programmierkenntnisse

Leistungsnachweis

  • Regelmäßige und aktive Teilnahme
  • Lektüre
  • Übungsaufgaben
  • Gruppenprojekt

Inhalt

Die Veranstaltung dient dazu, praktische Erfahrungen in der Anwendung einfacher Verfahren des maschinellen Lernens zu erwerben. Theoretische Vorkenntnisse im Bereich des maschinellen Lernens sind hilfreich, aber keine Voraussetzung. Im ersten Teil der Veranstaltung werden zwei grundlegende Lernverfahren behandelt: Entscheidungsbäume und der Naive Bayes Algorithmus. Im zweiten Teil werden wir über die Organisation eines Experiments sprechen. Wir werden die Data-Mining-Software WEKA kennenlernen, um diese zwei Algorithmen praktisch anzuwenden. Hierfür werden praktische Aufgaben aus einem Anwendungsfeld der Computerlinguistik in Gruppenarbeit zu lösen sein.

Kursübersicht

Seminarplan

Datum Sitzung Materialien
Theorie Übung Projekt
21.10. Einleitung Folien (12.11.)
28.10. Überwachtes Lernen Folien (12.11.) Projektvorschläge (27.10.)
04.11. Entscheidungsbäume Folien (19.11.) Aufgaben (04.11.) Projekte: Literatur, Daten, Organisation (03.11.)
11.11. Aufgaben (12.11.) Datenbeispiele (12.11.), XML+DTD + Beispiel (12.11.), Features (mm) (13.11.)
18.11. Weka Folien (19.11.) Aufgaben (19.11.)
25.11. Aufgaben (25.11.) cars_with_names.arff - Quelle: nominal-Ordner des StatLib-Datensatzes auf http://www.cs.waikato.ac.nz/ml/weka/datasets.html
02.12. Evaluierung Folien (16.12.) Aufgaben (02.12.)
09.12. ENTFÄLLT Aufg. zu Hause: Statusreport (02.12.) Statusreport (mm) (02.12.)
16.12. Evaluierung Forts. Besprechung des Statusreports Referat (mm) (05.12.), Empfehlungen für das Referat - Quelle: www.student-online.net
13.01. NaiveBayes Folien (17.01.) Aufgaben (17.01.) Code (mm) (02.12.)
20.01. Parameter Folien über SVM und Kernels von Alessandro Moschitti, Folien (20.01.)
27.01. Projekt-Referat wsd und ner3
03.02. Projekt-Referat ner1 Bewertung (02.02.)
Nach den Links wird jeweils das Datum der letzten Änderung angegeben.

Literatur

  • Tom Mitchell: Machine Learning. McGraw-Hill, 1997.
  • Ian Witten and Eibe Frank. Data Mining. Morgan Kaufman, 2005.
  • Chris Manning and Hinrich Schütze. Foundations of Statistical Natural Language Processing. MIT Press, 1999.

» weitere Kursmaterialien

zum Seitenanfang