morphy

Im Zeitraum 1990-2001 ist Morphy, ein frei verfügbares Softwarepaket für die morphologische Analyse und Synthese und die kontextsensitive Wortartenbestimmung des Deutschen entstanden.

Die Anfänge des Projekts lagen in meinem Studium an der Universität Paderborn. Im Rahmen meiner Tätigkeit in der Arbeitsgruppe Kognitionsforschung, Universität Paderborn, wurde Morphy bzgl. des Lexikons und des Wortarten-Tagging erweitert. Während der Anstellungen am Centrum für Informations- und Sprachverarbeitung CIS, LMU München und am Institut für Maschinelle Sprachverarbeitung IMS, Universität Stuttgart, konnte ich Morphy weiter pflegen und vorantreiben.

Da die Weiterentwicklung eingestellt worden ist, verwenden Sie Morphy as is, d.h. auf eigenes Risiko, ohne jegliche Haftung und Gewährleistung und vor allem ohne Support.

Morphologische Analyse und Synthese

  • Stammformenlexikon mit über 50.000 Einträgen (ca. 350.000 Vollformen, alte Rechtschreibung)
  • morphologische Analyse und Synthese
  • Wortklassenprognose für unbekannte Wortformen
  • interaktive Lexikonpflege zur Minimierung von Benutzereingaben

Kontextsensitive Wortartenbestimmung

  • Verwendung eines kleinen (51 Tags) und eines großen (456 Tags) Tag Sets
  • Korrektheitsraten von ca. 96% für das kleine und ca. 85% für das große Tag Set
  • hohe Robustheit gegenüber unbekannten Wortformen
  • Ermittlung des Wortstamms beim Tagging (echte Lemmatisieren)