< Zurück
Inhalt
Weiter >
Nebenbei: Joker-Morphe
- Wenn irgendwo nicht mehr weiter segmentiert werden kann, bleibt der Parser stehen
- Idee: Einzelne Buchstaben überspringen, dann weiter versuchen
- Wenn irgendwann wieder segmentiert werden kann, ist der übersprungene Teil ein Joker!
- Neuer Stand:
- Python-Source: 52 LOC (!)
- Nur noch 31 der Gutenberg-Worte nicht segmentiert (0,1%)!
- Aber: 50 Zerlegungen für "Wahrscheinlichkeitsrechnung"
- Neues Problem: Welche Zerlegungen sind richtig, welche falsch?
- Nachträgliche Bewertung der Zerlegungen
- Die Varianten mit den wenigsten Jokern werden bevorzugt
- => Nur noch 4 Zerlegungen für "Wahrscheinlichkeitsrechnung"