De Kölschifier - Konzeption

 

Zur Arbeitsweise des Kölschifiers

Die Arbeitsweise des Kölschifiers soll hier am Beispiel der Wortart Nomen genauer dargestellt werden. Die Darstellung orientiert sich dabei wieder an den vier Übersetzungsschritten:

  1. Eingabe & Tagging
  2. Nachschlagen im Kölschen Wörterbuch
  3. OPTIONAL: Analyse
  4. OPTIONAL: Generierung
  5. Ausgabe

Tagging

Die Eingabe wird mit einem externen Programm zunächst gettaged (in Wortkategorien zerlegt). Das Problem des Erkennens von Satzgrenzen (siehe CaseSanitizer) wird so umgangen. Der Tagger legt von jedem eingegebenen Wort eine Instanz der Klasse "Word" an. Der Start des Tagger liefert eine ArrayList der Instanzen von Word an die Kontroll-Klasse Kölsch zurück [Mehr...]

Nachschlagen im Wörterbuch

Viele Wörter können ohne aufwendige Analyse übersetzt werden. Konjunktionen und Partikel können eins-zu-eins aus dem Wörterbuch übersetzt werden. Bei anderen Wortarten braucht zur Analyse noch weitere Informationen aus dem Wörterbuch (etwa das Genus von Nomen). Diese liefert auch das Nachschlagen im Wörterbuch. [Mehr...]

Analyse

Bestimmte Wortarten wie Verben und Nomen können nicht direkt übersetzt werden, da es nur ein Stammformenlexikon gibt. Daher muss hier eine morphologische Analyse erfolgen. Die Eingrenzung erfolgt entweder über die Analyse von Suffixen, Umlautungen oder Auslautungen des Lemmas, sowie über eine Überprüfung von vorangehenden oder nachfolgenden Wortarten. [Mehr...]

Generierung

Manche Wortarten müssen generiert werden (etwa Diminutiva bei Nomen). Darüber hinaus soll ein Pseudo-Kölsch generiert werden, wenn keine Übersetzung nach der Eingabe oder der Analyse erfolgen konnte. [Mehr...]

Ausgabe

Die einzelnen Wörter werden in ihrer Reihenfolge in der Zielsprache ausgegeben. [Mehr...]