Einführung in die Nutzung computerlinguistischer Ressourcen
Kursbeschreibung
Studiengang | Modulkürzel | Leistungs- bewertung |
---|---|---|
Magister | - | - |
Dozenten/-innen | Tri Duc Nghiem |
Veranstaltungsart | Übung |
Erster Termin | 06.10.2014 |
Zeit und Ort | 06.10.–10.10.2014, 09:00–17:00, INF 325 / PCPool (SR) |
Commitment-Frist | tbd. |
Teilnahmevoraussetzungen
Programmieren 1 (P I), Grundlagen der Linux/Unix-Bedienung.
To register, please send an e-mail to the lecturer (better in English), Subject starts with [Resources-Vorkurs]
Leistungsnachweis
Regelmäßige Teilnahme und Bearbeitung von Übungsaufgaben.
Die erfolgreiche Teilnahme am Blockkurs ist Voraussetzung für die Teilnahme am Softwareprojekt.
Inhalt
Der Vorkurs gibt Grundlagen in der Nutzung von GNU/Linux-basierten(computerlinguistischen)
Tools sowie der vorhandenen Korpora. Dabei gehtes sowohl um allgemeine Grundlagen
der Shell (wie z.B.Ein-/Ausgabeumleitung) als auch um einzelne Toolkits im Speziellen.
Wirwerden uns anschauen, wie bestimmte Tools zu benutzen sind, was man ausihnen herausbekommt
(und was nicht) und wie man solche Ausgabenautomatisch weiterverarbeiten kann (und
zum Beispiel an das nächste Toolweiterverfüttert). Zudem umfasst der Kurs eine Kurzeinführung
inMapReduce und den am Institut vorhandenen Hadoop Cluster.
Kursübersicht
Seminarplan
Datum | Sitzung | Materialien |
Monday 06/10/14 | Intro 1 Intro 1b Intro 2 |
Uebung 1 Uebung 2 |
Tuesday 97/10/14 | Resources , XML/XSLT, NLTK |
Uebung 3, Uebung 4 , Uebung 5 |
Wednesday 08/10/14 | Weka , CQP , Parser, TreeTagger |
Uebung 6 , Uebung 7 , Uebung 8 , Uebung 9 |
Thursday 09/10/14 | SVN ,
Small Tools , Maven, UIMA |
Uebung 10 ,
Uebung 11 Uebung 12 |
Friday 10/10/2014 |
Web Anno Big Data , Map Reduce |
Uebung 13 |
Literatur
Literatur wird zu Beginn der Veranstaltung bekanntgegeben.