Ruprecht-Karls-Universität Heidelberg
Bilder vom Neuenheimer Feld, Heidelberg und der Universität Heidelberg
Siegel der Uni Heidelberg

Korpuslinguistik

Kursbeschreibung

DozentInnen Andrea Zielinski
Veranstaltungsart Vorlesung
Zeit und Ort Fr, 11:15 - 12:45, INF 325 / SR 24 (SR)
Studiengang ABA, Magister, NBA
Modul-Kürzel ABA: A12, NBA: CS-CL, BS-CL, BS-AC
Leistungsbewertung ABA: 4 LP
ÜK: 2 LP
NBA: 4 LP (Klausur) oder 6 LP (Klausur und Referat)

Teilnahmevoraussetzungen

Die Teilnehmerzahl für diese Veranstaltung ist begrenzt. Bei zu vielen Teilnehmern haben Studierende der Computerlinguistik Vorrang.

Leistungsnachweis

Leistungsnachweis ist eine Klausur (4 LP) oder Referat und Klausur  (6 LP)

Inhalt

In der Korpuslinguistik werden linguistische Datensammlungen (Sprachkorpora) systematisch gesammelt und gepflegt, da sie die Basis für linguistische Forschung bilden und zur Überprüfung linguistischer Theorien dienen können. Der Begriff 'Korpus' ist definiert als "eine Sammlung schriftlicher oder gesprochener Äußerungen in einer oder mehrerer Sprachen. [...] Die Bestandteile des Korpus, die Texte oder Äußerungsfolgen, bestehen aus den Daten selbst sowie möglicherweise aus Metadaten, die diese Daten beschreiben, und aus linguistischen Annotationen, die diesen Daten zugeordnet sind." (Lemnitzer/Zinsmeister).

In der Vorlesung geht es um den Einsatz von Korpora in unterschiedlichen Bereichen der Sprachwissenschaft. Ausgehend von den theoretischen Fragestellungen (z. B. in der computerunterstützten Lexikographie oder der Maschinellen Übersetzung) werden grundlegende korpuslinguistische Methoden vorgestellt. Dazu gehören insbesondere effiziente Technologien für die Korpussuche mit Tools wie XAIRA, Cosmas oder TigerSearch als auch Werkzeuge zur quantitativen Analyse (Kookkurrenzanalyse, Translation Memories, etc.).

Kursübersicht

Seminarplan

Datum Sitzung Materialien
23.10. Einführung in die Korpuslinguistik: Empirismus vs. Rationalismus Folien
06.11. Texttechnologische Standards Folien Aufgabe 1
13.11. Korpuskompilation und -preprocessing Folien Aufgabe 2
20.11. Korpuspreprocessing II Folien Aufgabe 3
27.11. Korpusrecherche in der Lexikographie Folien Aufgabe 4
04.12. Korpora und gesprochene Sprache Folien
11.12. Statistik für Korpuslinguisten (Folien s. Wiki)
18.12. Kollokationen und Syntaxanalyse Folien (Folien s. Wiki)
08.01. Korpusrecherche mit dem BNCweb Aufgabe 5 (.doc) | .pdf
(Aufgaben s. Wiki)
15.01. Evaluierung & Korpora und Dialektologie Folien
(Folien s. Wiki)
22.01. Lernerkorpora und Korpora in der MÜ (Folien s. Wiki)
29.01. Korpora in der Historischen Linguistik und Editionsphilologie Folien

Literatur

  • L. Lemnitzer/H. Zinsmeister, Korpuslinguistik: Eine Einführung, Narr, Tübingen 2006
  • Ausgewählte Artikel aus: Anke Lüdeling & Merja Kytö (Hgg.) (erscheint 2008): Corpus Linguistics. An International Handbook. Mouton de Gruyter, Berlin.
  • K.-U. Carstensen, C. Ebert, C. Endriss, S. Jekat, R. Klabunde and H. Langer (ed.): Computerlinguistik und Sprachtechnologie - Eine Einführung. Heidelberg, Spektrum-Verlag. 2001

 

Hier gehts zum Wiki