Designing Experiments for Machine Learning Tasks
Kursbeschreibung
Studiengang | Modulkürzel | Leistungs- bewertung |
---|---|---|
BA-2010[100%|75%] | CS-CL | 6 LP |
BA-2010[50%] | BS-CL | 6 LP |
BA-2010[25%] | BS-AC | 4 LP |
NBA[100%|75%] | CS-CL | 6 LP |
NBA[50%|25%] | BS-CL, BS-AC | 4 LP |
Magister | - | - |
Dozenten/-innen | Éva Mújdricza-Maydt |
Veranstaltungsart | Proseminar |
Erster Termin | 21.10.2013 |
Zeit und Ort | Mo, 14:15–15:45, INF 327 / SR 4 |
Commitment-Frist | 02.12.2013 – 17.01.2014 |
Teilnahmevoraussetzungen
Programmierkenntnisse
Leistungsnachweis
- Regelmäßige und aktive Teilnahme
- Lektüre
- Übungsaufgaben
- Gruppenprojekt
Inhalt
Die Veranstaltung dient dazu, praktische Erfahrungen in der Anwendung einfacher Verfahren des maschinellen Lernens zu erwerben. Theoretische Vorkenntnisse im Bereich des maschinellen Lernens sind hilfreich, aber keine Voraussetzung. Im ersten Teil der Veranstaltung werden zwei grundlegende Lernverfahren behandelt: Entscheidungsbäume und der Naive Bayes Algorithmus. Im zweiten Teil werden wir über die Organisation eines Experiments sprechen. Wir werden die Data-Mining-Software WEKA kennenlernen, um diese zwei Algorithmen praktisch anzuwenden. Hierfür werden praktische Aufgaben aus einem Anwendungsfeld der Computerlinguistik in Gruppenarbeit zu lösen sein.
Kursübersicht
Seminarplan
Datum | Sitzung | Materialien | ||
Theorie | Übung | Projekt | ||
21.10. | Einleitung | Folien (12.11.) | ||
28.10. | Überwachtes Lernen | Folien (12.11.) | Projektvorschläge (27.10.) | |
04.11. | Entscheidungsbäume | Folien (19.11.) | Aufgaben (04.11.) | Projekte: Literatur, Daten, Organisation (03.11.) |
11.11. | Aufgaben (12.11.) | Datenbeispiele (12.11.), XML+DTD + Beispiel (12.11.), Features (mm) (13.11.) | ||
18.11. | Weka | Folien (19.11.) | Aufgaben (19.11.) | |
25.11. | Aufgaben (25.11.) | cars_with_names.arff - Quelle: nominal-Ordner des StatLib-Datensatzes auf http://www.cs.waikato.ac.nz/ml/weka/datasets.html | ||
02.12. | Evaluierung | Folien (16.12.) | Aufgaben (02.12.) | |
ENTFÄLLT | Aufg. zu Hause: Statusreport (02.12.) | Statusreport (mm) (02.12.) | ||
16.12. | Evaluierung Forts. | Besprechung des Statusreports | Referat (mm) (05.12.), Empfehlungen für das Referat - Quelle: www.student-online.net | |
13.01. | NaiveBayes | Folien (17.01.) | Aufgaben (17.01.) | Code (mm) (02.12.) |
20.01. | Parameter | Folien über SVM und Kernels von Alessandro Moschitti, Folien (20.01.) | ||
27.01. | Projekt-Referat wsd und ner3 | |||
03.02. | Projekt-Referat ner1 | Bewertung (02.02.) |
Literatur
- Tom Mitchell: Machine Learning. McGraw-Hill, 1997.
- Ian Witten and Eibe Frank. Data Mining. Morgan Kaufman, 2005.
- Chris Manning and Hinrich Schütze. Foundations of Statistical Natural Language Processing. MIT Press, 1999.