Ich habe das German Novel Beispielprojekt von Grund auf neu erstellt und ausgeführt. Die Ausgabe enthält Tags wie Lemma & Token, kann jedoch keine Funktionen finden, die die Informationsteilen des Tokens enthalten. Wie bekomme ich es?Wie man Teile der Rede Informationen in Ruta von deutschen Roman Uima Ruta Beispiel bekommen?
0
A
Antwort
0
Der Teil der Sprachinformationen sollte in der pos
-Funktion des Tokens gespeichert werden. Diese Anmerkungen sind ebenfalls im Index des CAS, z. B. sollten Anmerkungen des Typs de.tudarmstadt.ukp.dkpro.core.api.lexmorph.type.pos.POS
wie de.tudarmstadt.ukp.dkpro.core.api.lexmorph.type.pos.N
vorhanden sein. Wenn diese Informationen fehlen, liegt ein Problem mit dem POS-Tagger vor.
Bedeutet dies, dass bei der TreeTagger-Installation ein Problem auftreten könnte? Wie man es löst? –
Es ist in der deutschen Anleitung beschrieben, und es gibt eine [Screencast auf youtube] (https://www.youtube.com/watch?v=MUgVncR5vwg). Ich habe es seit einiger Zeit nicht mehr gemacht, da DKPro jetzt einfachere Optionen zum Installieren/Ausführen des Taggers bietet. Vielleicht ist es einfacher, den TreeTagger durch den OpenNLP zu ersetzen. –