Ich versuche, einen Tokenizer mithilfe von Java-API (ohne die von Stanford, Apache OpenNLP bereitgestellten) zu erstellen. ich waren in der Lage, die Worte zu trennen, indem Sie regex und Java-Muster/Matcher:Erstellen von Java Lemmatizer
"[a-zA-Z]+".
Ich möchte nun das Lemma des Wortes zu finden. Ich möchte StanfordNLP wegen seiner Lizenzprobleme nicht verwenden. Was nun? Ich denke, ich brauche ein Wörterbuch als ein Modell zu verweisen/zu vergleichen. Und ...? Ist jemand dort gewesen? Versuchen Sie, ein Wort Lemmatizer mit Java zu erstellen? Danke im Voraus. :)
Warum der Downvote? – dirai