Spezifikation

 

Wir befassen uns im Moment mit dem syntaktischen System von PLAIN (cf. Hellwig 1980). Die Syntax-Komponente enthält ein Set von Templates und ein Set von Syntax Frames (Synframes). Templates sind allgemeine Beschreibungen aller syntagmatischen Beziehungen in der Sprache und sind vergleichbar mit den Regeln einer Phrasenstrukturgrammatik. Die Templates werden den einzelnen Wörtern in einer Synframe zugeordnet. Synframes sind mehr oder weniger äquivalent mit der lexikalischen Subkategorisierung in der Phrasenstrukturgrammatik. Ein Template ist eine Liste aus Head und Slot. Jedes Template bezieht sich exakt auf den einen Übergang zwischen zwei Knoten im Dependenzbaum und beschreibt eine einzige syntagmatische Beziehung, z. B. zwischen Verb und Subjekt, Verb und Objekt, Noun und Determiner etc. Wenn ein Wort mehrere Ergänzungen hat, muß mehr als ein Template zugeordnet werden.

 

 

(template[+subject] category[verb] form[finite,subjunctive] s_type[statement] s_position[6]

 

(< slot[regular] role[subject] category[noun] person[C] determined[+] s_position[4]))

 

 

 

 

(template[+phrasal] category[verb] s_position[6]

 

(> slot[regular, select] role[phrasal_part] category[particle] s_position[14,19]))

 

 

 

 

(template[+dir_object] category[verb] voice[active] s_position[6]

 

(> slot[regular] role[dir_object] category[noun] determined[+] s_position[17]))

 

 

Fig. 1   Beispiele für Templates

 

Fig. 1 zeigt die Templates für das Verb pick mit dem Subjekt the robot, dem Partikel up und dem direkten Objekt a big red block. Die Heads in den drei Templates beziehen sich alle auf das Verb. Es sind drei Templates nötig, weil pick drei Ergänzungen hat.

 

Ein Synframe ist eine bestimmte Anordnung von syntagmatischen Beziehungen eines Wortes. Ein Lexem repräsentiert ein Wort als solches, wie ein Keyword im Lexikon. Wenn das Wort mehr als eine lexikalische Bedeutung hat, wird durch Angabe eines Readings disambiguiert. Ein Synframe stellt ein Set von syntagmatischen Beziehungen dar, die mit dem Wort zur gleichen Zeit kombiniert werden. Sie bestehen aus Komplementen und Adjunkten und werden durch beliebige Referenzen auf Komplement- oder Adjunkt-Templates dargestellt. Oberflächenvariationen (z. B. Aktiv/Passiv) werden durch alternative Templates mit gleichem Namen dargestellt.

 

 

(lexeme[surprise] reading[amaze] category[verb]

 

(complement[+subject, +subject_that, +subject_toinf])

 

(complement[none, +dir_object]))

 

 

(lexeme[head] reading[leader] category[noun]

 

(complement[+prep_attribute] lexeme[of]))

 

(lexeme[last] reading[continue] category[verb]

 

(complement[+subject]

 

(expected_adjunct[%adverb_duration]))

 

 

(lexeme[on] category[preposition]

 

(complement[+phrase])

 

(adjunct[%adverb_place]))

 

 

 Fig. 2   Beispiele für Synframes

 

Dem Lexem werden also verschiedene Templates zugewiesen. Zuerst wird das Lexem angegeben, dann ein Reading, dann die Kategorie. Anschließend folgt eine beliebige Anzahl von Komplementen oder Adjunkten. Alternativen von Komplementen oder Adjunkten der gleichen Art werden durch Komma dargestellt.

Auf der Grundlage des Collins Cobuild English Dictionary soll ein Valenzlexikon für das Englische erstellt bzw. vervollständigt werden. Jedem Eintrag im Wörterbuch soll ein Synframe zugeordnet werden. Die spezielle Vorgehensweise dafür ist in einer Hilfsdatei (instruction.txt) beschrieben. Eine Liste aller möglichen Komplemente und Adjunkte kann aus der Datei roles.txt entnommen werden. Alle möglichen Kategorien sind in der Datei catf.txt beschrieben.

 

Das PLAIN Syntax Tool

 

Mit dem PLAIN Syntax Tool soll die Eingabe der Synframes computerunterstützt und damit erleichtert werden. Dabei sollen die obengenannten Dateien während des Eingabevorgangs als Hilfe zur Verfügung stehen. Zielgruppe sind Linguisten, die teilweise mit dem PLAIN System vertraut sind.

 

Das PLAIN Syntax Tool besteht im wesentlichen aus drei Komponenten:

-  einem Eingabetool, mit dem neue Synframes erstellt werden

-  einer Komponente, die eine Wortliste aller bisherigen Synframes erstellt

-  einer Komponente, die doppelte Eingaben findet und löscht

 

Ablaufdiagramm

 

Nach Programmstart muß entweder ein bereits bestehendes Projekt (d. h. ein ASCII-File mit Synframes) geöffnet werden, oder es wird ein neues Projekt angelegt.  

 

Das geöffnete Projekt wird in einem Fenster angezeigt. Man kann nun eine neue Eingabe machen, eine Wortliste der bereits eingegebenen Synframes erstellen oder auf doppelt eingegebene Synframes prüfen (Doubletten).

Beim Eingeben eines neuen Synframes wird zuerst das Lexem eingegeben. Dann ein Reading, d. h. eine kurze Bedeutungserklärung, die frei gewählt wird oder aus dem Wörterbuch stammt. Als nächstes wird die Kategorie eingegeben. Diese kann auch aus einer Beispielliste der möglichen Kategorien gewählt werden.  Nun folgt ein Beispielsatz, der normalerweise aus dem verwendeten Wörterbuch/Lexikon stammt.

Dann können Complements und Adjuncts eingegeben werden. Für jedes Complement oder Adjunct wird ein Fenster geöffnet, in das man die Eingabe macht und ggf. ein Lexem eingibt. Mögliche Complements und Adjuncts können einem Beispielfile entnommen werden. Nach kompletter Eingabe des Synframes wird dieser automatisch in einen Klammerausdruck umgewandelt und in der Projektdatei gespeichert. Das Eingabefenster leert sich, und es kann mit einer neuen Eingabe begonnen werden. Durch drücken von EXIT kann das Eingabefenster verlassen werden.

 

Benötigte Funktionen:

 

PROGRAMM

Exit()

Beendet das Programm

 

Open(project.asc)

Öffnet eine bestehende Projektdatei

 

Create(project.asc)

Erstellt eine neue Projektdatei (=leere ASCII-Datei)

 

Help()

Zeigt instruction.asc an

 

Modul WORDLIST

Wordlist(project.asc)

Erstellt eine Liste der Lexeme in einer Synframe-Datei. Ihr wird eine ASCII-Datei übergeben, sie gibt eine ASCII-Datei zurück, die eine Liste der Wörter enthält.

 

Modul DOUBLETTES

Find_Doublettes(project.asc)

Bekommt übergeben die Projektdatei und sucht nach doppelten Synframes. Löscht die doppelten Synframes aus der Datei und gibt die geänderte Datei zurück.               

 

Modul NEW_ENTRY

New_Entry(project.asc)

Erstellt einen neuen Eintrag für ein Synframe. Eine ASCII-Datei wird übergeben, in die die neuen Einträge gespeichert werden. Einlesen von  Lexeme, Reading, Category und Beispielsatz. Zeigt bisherige Eingabe von Complements, Adjuncts und Expected Adjuncts an. Speichert den neuen Eintrag in die Datei. Gibt die Datei zurück. Wird ausgeführt, bis sie durch Exit beendet wird.

Schnittstelle zu Show_Catf(), Complement(), Adjunct(), Expected_Adjunct()

 

Complement()

Erstellt ein oder mehrere Complements, Adjuncts oder Expected  Adjuncts (Alternativen) und alternativ ein Lexem und gibt diese an New_Entry zurück

Schnittstelle zu Show_Roles()

 

Show_Catf()

Zeigt die ASCII-Datei catf.asc an, die alle möglichen Kategorien enthält

 

Show_Roles()

Zeigt die ASCII-Datei roles.asc an, die alle möglichen Complements, Adjuncts und Expected Adjuncts enthält

 

zurück zur Startseite                                                                                Abschlußbericht