
Text Mining
Kursbeschreibung
Studiengang | Modulkürzel | Leistungs- bewertung |
---|---|---|
BA-2010[100%|75%] | CS-CL | 6 LP |
BA-2010[50%] | BS-CL | 6 LP |
BA-2010[25%] | BS-AC, BS-FL | 4 LP |
Dozenten/-innen | Andrea Zielinski |
Veranstaltungsart | |
Sprache | Deutsch |
Erster Termin | 25.04.2025 |
Zeit und Ort | Freitags, 10:15-11:45, INF 327 / SR 5 |
Commitment-Frist | tbd. |
Teilnehmerkreis
Für Studierende der Computerlinguistik (mind 25%) sowie für Studierende des MSc Data and Computer Science, die Computerlinguistik als Anwendungsgebiet gewählt haben und mit dem Dozenten Rücksprache gehalten haben.
Teilnahmevoraussetzungen
Grundbegriffe in Statistik
Leistungsnachweis
- Beteiligung an der Diskussion im Seminar
- Seminarvortrag
- Wöchentliche Lektüre von 1-2 Papieren
Inhalt
Dieses Seminar bietet Ihnen einen umfassenden Überblick über die vielfältigen Methoden des Text Mining und der Textgenerierung. Entdecken Sie spannende Anwendungsgebiete, die von der Sentiment- und Polaritätsbestimmung über Topic Modeling bis hin zur Trendanalyse reichen.
Lernen Sie, wie moderne Sprachmodelle zur automatischen Textproduktion eingesetzt werden, und erfahren Sie, welche Verfahren es gibt, um Textzusammenfassungen zu erstellen und kreative Inhalte zu generieren. Außerdem werfen wir einen Blick auf innovative KI-gestützte Tools, die beim Schreiben von wissenschaftlichen Definitionen wertvolle Unterstützung bieten.
Ein weiterer zentraler Bestandteil des Seminars ist die Evaluierung von NLP Systemen. Wie kann man sicherzustellen, dass automatisch generierter Texte nicht nur kohärent und flüssig, sondern auch faktisch korrekt sind? Zusätzlich werden wir die Architektur der Retrieval Augmented Generation (RAG) untersuchen, die es ermöglicht, externe Wissensquellen zu nutzen, um die Qualität und Relevanz generierter Texte zu verbessern.
Kursübersicht
Ein Zeitplan und weitere Informationen finden Sie hier.Literatur
- Daniel Jurafsky and James H. Martin, "Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition with Language Models", 2025, 3rd edition, https://web.stanford.edu/~jurafsky/slp3/
- Ian Goodfellow and Yoshua Bengio and Aaron Courville “Deep Learning” An MIT Press book Deep, 2016, https://www.deeplearningbook.org/
- Lewis Tunstall, Leandro von Werra, Thomas Wolf, "Natural Language Processing with Transformers", O'Reilly Media, Inc.", 2022
- Einzelne Publikationen aus der ACL Anthology (ACL, COLING, EMNLP, etc.), Conference and Labs of the Evaluation Forum (CLEF) sowie den SemEval Tracks
Weitere Referenzen werden zu Beginn des Seminars bekannt gegeben.