< Zurück
Inhalt
Weiter >
Erste Schritte
- Wahl zweier Korpora
- Aufbau der Morph-Datenbank: Project Gutenberg (gutenberg.spiegel.de)
- Evaluation des Systems: Wikipedia (de.wikipedia.org)
- Beide Korpora wurden nach groß geschriebene Wörtern durchsucht
- Ergebnis: Zwei Wortlisten (28.873 bzw. 863.636 Worte)
- Gutenberg-Liste wurde nach Wortlänge sortiert und manuell segmentiert
- Dabei Unterstützung durch www.canoo.net