De Kölschifier - Probleme & Aufgaben

 

Morphologische Analyse

Da das Lexikon nur Stammformen aufweist, wird eine morphologische Analyse notwendig. Vereinfacht wird diese Analyse durch den verwendeten Tagger. Das externe Programm liefert die Wortart und die Stammform der Eingabe - sofern eine Entsprechung im Lexikon des Taggers gefunden wurde.

Umschreibung mit "tun"

Im Kölschen werden Sätze häufig mit "tun" (kö.: "dun") umschrieben. Dieses typische Muster soll - wenn möglich - auch von dem Programm beherrscht werden.

Unterschiedliche Verbflexiven im Kölschen

Im Kölschen gibt es allein bei den schwachen Verben 11 verschiedene Flexionsparadigmen, die abhängig sind von dem/den Auslaut/en des jeweiligen Stammmorphems.

Es gibt daneben dann natürlich noch die starken Verben, die sich leider nicht ähnlich "gut" klassifizieren lassen.

Geschwindigkeit

Der Aufruf des Taggers ist ziemlich zeitintensiv (das Laden des Kölschen Wörterbuches geht dahingegen recht schnell). Da das Programm online zur Verfügung stehen soll, kann es relativ lange dauern, bis der Benutzer die Übersetzung vom Sever geliefert bekommt.
Eine Lösung wäre, das Programm als ein Serverprogramm laufen zu lassen, welches verschiedene Clients bedient. Der Tagger würde dabei auch dauernd aktiv sein und auf Nachfragen warten.
Aufgrund der starren Architektur (strikte Aufteilung in Wörterbuch-Abgleich, Analyse und Generierung) erscheint auch Multi-Threading relativ einfach.