De Kölschifier - Analyse & Übersetzung

 

Analyse mit weiteren Übersetzungen

Die Analyse funktioniert fast ausschließlich über das Wörterbuch und die Daten des Taggers (Wortart und Lemma).

Das Wörterbuch liefert bei Verben, Nomen und Adjektiven wichtige grammatische Informationen. Über die Wortart und das Lemma kann eine morphologische Analyse gemacht werden. Beispielhaft soll hier die Abarbeitung eines Nomens skizziert werden. Zunächst eine einfache Überprüfung:

  1. Die Wortart "Substantiv" (Tag: NN für normale Nomen oder NE für Eigennamen) wurde erkannt.
  2. Gibt es eine Übereinstimmung zwischen Eingabe und Lemmaform?

Morphologische Analyse eines Nomens:

  1. Aus dem Wörterbuch wird das Geschlecht und das Kölsche Lemma geholt.
  2. Der Auslaut wird ermittelt und das Vorhandensein einer Umlautung wird festgestellt.
  3. Nun wird nach Eindeutigen morphologischen Endungen gesucht. Etwa:
    • "-es"-Auslaut --> Person: Singular; Kasus: Genitiv.
    • "-ern"-Auslaut --> Person Plural; Kasus: Dativ.
    • "-en"-Auslaut + Umlaut --> Person: Plural. Kasus: Dativ.
    • Umlaut + kein Auslaut --> Perosn: Plural.
    • etc

Problemfälle bei der Morphologischen Analyse, wenn Auslaute ambig sind:

  1. Der Auslaut "-s" kann sowohl den Genitiv im Singular ("Würde des Gerichts") als auch eine Pluralform ("die Autos") anzeigen. In einem solchen Fall müssen weitere Überprüfungen stattfinden:
    • In einem solchen Fall kann nach bestimmten vorangehenden Wortarten gesucht werden.
      1. Bestimmten und unbestimmten Artikel. In dem Beispiel ("Würde des Gerichts") ist der Artikel "des" eindeutig und weist auf Genitiv hin.
      2. Dann wird nach Possesivpronomen ("Die Würde meines Gerichts...") gesucht.
      3. Auch Relativpronomen, Indfinitpronomen ("jedes Gerichts") usw. können zur Disambiguierung beitrangen.
  2. Es liegt ein Substantiv2 vor. Diese Substantive haben außer im Nominativ Singular alle die Endung "en" (der Affe, des Affen, dem Affen, den Affen, etc). Hier kann nur eine Überprüfung vorangehender Wortarten helfen.

Vielfach werden die Übersetungen bereits in diesem Stadium generiert. Ein paar Ausnahmen werden aber erst später zusammengesetzt. Etwa die Diminutiva bei den Nomen. [zur Generieung]