RO-Stemmer mit Snowball
Studienprojekt von Marina Stegarescu, Doina Gliga und Erwin Glockner
(WS 2005/06, SS 2006)
Dokumentation
Source Codes
- stem.sbl.txt (Der Snowball-Code im Text-Format. - "Hauptcode" des Projekts.)
- stop_out.py (Entfernt stop-words aus einer Liste von Wörter.)
- compare.py (Vergleicht zwei Listen und errechnet Prozentsatz der Übereinstimmungen.)
- wordS_18.c (Liest einen Text ein, entfernt doppelte/gleiche Wörter, und gibt eine Liste alphabetisch geordnet aus.)
- compW.c (Gleiche Funktion wie compare.py, nur in c.)
Evaluation
- Selektierte Wortliste
- Zufällige Wortliste
- Ergebnis (s. Abschlußvortrag oben!)
Paket an Porter
Snowball
Kontakt