************** RoSnowball.txt ************** (UTF-8) ---------- Studienprojekt: RO-Stemmer mit Snowball (Marina Stegărescu, Doina Gligă, Erwin Glockner) WS 2005/06, SS 2006 ---------- Hinweis: Diese Erklärung ist wie ein Tutorial gehalten, so dass künftige Snowball-Interessierte die Schritte leichter nachvollziehen können. Diese Schritt-für-Schritt Anleitung soll die Schritte erklären die wir für die Vorbereitung des Unterordners "./RoSnowball" verwendet haben, und sollte NICHT (!) zusammen mit "install.txt" durchgeführt werden. Die Tarball-Dateien die man von "http://snowball.tartarus.org/download.php" herunterladen kann (Stand: März 2006), sind leider nicht ganz vollständig. Man muss Elemente von "snowball_all.tgz" und "snowball_code.tgz" kombinieren damit alles klappt. Wir gehen davon aus, dass die beiden Tarball-Dateien entpackt wurden und die Namen beibehalten wurden. Wir benutzen dann den snowball_code-Ordner als Hauptverzeichnis. 1. Um das Testprogramm "stemwords" benutzen zu können muss man sich noch die Datei "modules.txt" herunterladen. (Einfach als Sucheingabe auf der Snowball-Homepage eingeben.) Diese kopiert man dann in den Unterordner "snowball_code/libstemmer". 2. Um alle Sprachen/Stemmer benutzen zu können, muss man aus dem snowball_all-Order das Verzichnis "algorithms" in den snowball_code-Ordern kopieren. Der dortige gleichnamige Order kann ruhig überschieben werden. 3. Um den eigenen Stemmer testen zu können benutzen wir das bereits vorhandene Testprogramm "stemwords". Um das Makefile ("GNUmakefile") benutzen zu können, müssen noch ein paar Änderungen vorgenommen werden. In "modules.txt" muss man nun die eigene/neue Sprache noch hinzufügen. Durch diese Datei wird später anhand des Perl-Scriptes im gleichen Verzeichnis eine neue Datei generiert ("modules.h") die für den gesamten Kompiliervorgang wichtig ist. Dies geschieht allerdings automatisch durch das Makefile. In "GNUmakefile" muss noch der neue Stemmer zu den anderen hinzugefügt werden, danach kann's losgehen. 4. Nun kann man "GNUmakefile" ausführen. Es dürfte hierbei keine Schwierigkeiten geben. (Windows-Nutzer, achtet auf die Hinweise in "install.txt" im Projekt-Hauptverzeichnis!) Das Makefile erzeugt die beiden ausführbaren Dateien "Snowball", als auch "stemwords". Es taucht auch ein neuer Order namens "src_c" auf. In diesem befinden sich alle von Snowball kompilierten c-Dateien mit ihren Header-Dateien. (Die Stemmer an sich sind Module, und müssen/können dementsprechend in eigene Programm eingebunden werden.) Im libstemmer-Ordner erscheint die oben erwähnte "modules.h". 5. Wer nun möchte, kann noch ein wenig "aufräumen". Mit dem Parameter "clean" entfernt das Makefile die nicht mehr benötigten o-Dateien. Allerdings wird auch der src_c-Ordner entfernt. Wer diesen beibehalten möchte, muss das Makefile entsprechend ändern. Sowohl Snowball als auch stemwords kann nun verwendet werden. ----- Nochmal zur Erinnerung: Damit diese Schritte nicht doppelt gemacht werden, und damit die Installationshinweise in "install.txt" einfacher sind, haben wir für die Vorbereitung des "./RoSnowball"-Ordners nach Schritt 3 aufgehört. Schritt 4 und 5 sind hier der Vollständigkeit, und der besser Verständnis halber auch mit aufgeführt.