De Kölschifier - Analyse & Übersetzung
Analyse mit weiteren Übersetzungen
Die Analyse funktioniert fast ausschließlich über das Wörterbuch und die Daten des Taggers (Wortart und Lemma).
Das Wörterbuch liefert bei Verben, Nomen und Adjektiven wichtige grammatische Informationen. Über die Wortart und das Lemma kann eine morphologische Analyse gemacht werden. Beispielhaft soll hier die Abarbeitung eines Nomens skizziert werden. Zunächst eine einfache Überprüfung:
- Die Wortart "Substantiv" (Tag: NN für normale Nomen oder NE für Eigennamen) wurde erkannt.
- Gibt es eine Übereinstimmung zwischen Eingabe und Lemmaform?
- JA: morphologische Analyse nicht mehr nötig. Übersetzung & Geschlecht wird im Wörterbuch nachgesclagen und in der Instanz "Word" gespeichert. Ende.
- NEIN: morphologische Analyse
Morphologische Analyse eines Nomens:
- Aus dem Wörterbuch wird das Geschlecht und das Kölsche Lemma geholt.
- Der Auslaut wird ermittelt und das Vorhandensein einer Umlautung wird festgestellt.
- Nun wird nach Eindeutigen morphologischen Endungen gesucht. Etwa:
- "-es"-Auslaut --> Person: Singular; Kasus: Genitiv.
- "-ern"-Auslaut --> Person Plural; Kasus: Dativ.
- "-en"-Auslaut + Umlaut --> Person: Plural. Kasus: Dativ.
- Umlaut + kein Auslaut --> Perosn: Plural.
- etc
Problemfälle bei der Morphologischen Analyse, wenn Auslaute ambig sind:
- Der Auslaut "-s" kann sowohl den Genitiv im Singular ("Würde des Gerichts") als auch eine Pluralform ("die Autos") anzeigen. In einem solchen Fall müssen weitere Überprüfungen stattfinden:
- In einem solchen Fall kann nach bestimmten vorangehenden Wortarten gesucht werden.
- Bestimmten und unbestimmten Artikel. In dem Beispiel ("Würde des Gerichts") ist der Artikel "des" eindeutig und weist auf Genitiv hin.
- Dann wird nach Possesivpronomen ("Die Würde meines Gerichts...") gesucht.
- Auch Relativpronomen, Indfinitpronomen ("jedes Gerichts") usw. können zur Disambiguierung beitrangen.
- Bei dem hier gewählten Beispiel ist eine Disambiguierung nach Auslaut möglich.
- Endet das Lemma mit einem Vokal (außer "e") --> Person = Singular; Genus = Genitiv.
- Endet das Lemma nicht mit einem Vokal (außer "e") --> Person = Plural.
- Die erste Art der Disambiguierung wird aber in anderen Problemfällen eingesetzt.
- Es liegt ein Substantiv2 vor. Diese Substantive haben außer im Nominativ Singular alle die Endung "en" (der Affe, des Affen, dem Affen, den Affen, etc). Hier kann nur eine Überprüfung vorangehender Wortarten helfen.
Vielfach werden die Übersetungen bereits in diesem Stadium generiert. Ein paar Ausnahmen werden aber erst später zusammengesetzt. Etwa die Diminutiva bei den Nomen. [zur Generieung]