/********************************************************************************* * Projekt: CaseSanitizer * Autoren: Hanna Peters und Youssef Sammari * Wichtige Hinweise zu CaseSanitizer *********************************************************************************/ -- Funktionsbeschreibung -- Das Programm CaseSanitizer ist ein Tool zur Bestimmung von Satzgrenzen bei englischen Texten! Es werden verschiedene Methoden verwendet, um den Text in einzelne Sätze zu zerlegen. Das Programm basiert im wesentlichen auf die Bestimmung bzw. Erkennung von Abkürzungen und Eigennamen. -- Installationshinweise -- - Voraussetzungen - - Zwingend erforderlich ist die glib-Bibliothek (ftp://ftp.gtk.org/pub/gtk/v2.5/)! - Das Tool ist in C (Linux) geschrieben und läuft damit auf allen Linux-Systemen. - Sollte auch unter Windows (z.B. mit Cygwin)laufen, natürlich mit glib-Bibliothek -- nicht getestet! - Kompilierung und Ausführung - Zum Kompilieren kann beigefügtes Makefile verwendet werden --> Aufruf aus src-Verzeichnis mit 'make CaseSanitizer' -- Projektstruktur -- Das Projekt besteht aus folgenden Verzeichnissen: - /doc --> Enthält Dokumentationen(Abstract, Spezifikation, Abschlussvortrag,ect.) - /res --> Enthält Ressourcen, z.B. Wortlisten, Textbeispiele, ect. - /src --> Enthält Quellcode-Dateien -- Bekannte Probleme -- Bei großen Texten ( größer 30KB) kann es vorkommen, dass die Ausgabe fehlerhaft dargestellt wird.