Ich bin auf der Suche nach einer Bibliothek, die eine morphologische Analyse deutscher Wörter durchführen kann, d. H. Sie konvertiert jedes Wort in seine Wurzelform und liefert Metainformationen über das analysierte Wort.Gibt es eine kostenlose Bibliothek zur morphologischen Analyse der deutschen Sprache?
Zum Beispiel:
gegessen -> essen
wurde [...] gefasst -> fassen
Häuser -> Haus
Hunde -> Hund
Meine Wunschliste:
- Es hat mit beiden Substantiven und Verben zu arbeiten.
- Ich bin mir bewusst, dass dies eine sehr schwierige Aufgabe ist angesichts der Komplexität der deutschen Sprache, daher suche ich auch nach Bibliotheken, die nur Näherungen liefern oder nur zu 80% genau sind.
- Ich würde Bibliotheken bevorzugen, die nicht mit Wörterbüchern arbeiten, aber wieder bin ich offen für Kompromisse angesichts der Umstände.
- Ich würde auch C/C++/Delphi Windows-Bibliotheken bevorzugen, weil das würde sie einfacher zu integrieren, aber .NET, Java, ... wird auch tun.
- Es muss eine freie Bibliothek sein. (L) GPL, MPL, ...
EDIT: Ich bin mir bewusst, dass es keine Möglichkeit gibt, eine morphologische Analyse ohne Wörterbuch überhaupt durchzuführen, wegen der unregelmäßigen Worte. Wenn ich sage, ziehe ich eine Bibliothek ohne Wörterbuch ich die Blas- Wörterbücher bedeuten, die jedes einzelne Wort Karte:
arbeite -> arbeiten
arbeitest -> arbeiten
arbeitet -> arbeiten
arbeitete -> arbeiten
arbeitetest -> arbeiten
arbeiteten -> arbeiten
arbeitetet -> arbeiten
gearbeitet -> arbeiten
arbeite -> arbeiten
...
Diese Wörterbücher mehrere Nachteile, einschließlich der enormen Größe und die Unfähigkeit, unbekannte Wörter zu verarbeiten.
Natürlich sind alle Ausnahmen können nur mit einem Wörterbuch behandelt werden:
esse -> essen
isst -> essen
eßt -> essen
aß -> essen
aßt -> essen
aßen -> essen
...
(Mein Verstand jetzt :) dreht)
Sie sind teilweise richtig, ich meine Frage aktualisiert. –