Ich benutze den Wordnet Lemmatizer über NLTK auf dem Brown Corpus (um festzustellen, ob die Substantive mehr in ihrer Singularform oder ihrem Plural verwendet werden). heißt from nltk.stem.wordnet imp
Ich wollte wordnet lemmatizer in python verwenden und ich habe gelernt, dass die Standard-POS-Tag ist NOUN und dass es nicht das richtige Lemma für ein Verb ausgeben, es sei denn, die POS-Tag explizit
Ich habe etwas Text in Französisch, den ich in einigen Weisen verarbeiten muss. Dafür muss ich: Zuerst tokenize den Text in Worte Dann diese Worte lemmatize Verarbeitung derselben Wurzel mehr zu verme