2016-07-21 9 views

Antwort

0

Dies ist ein Problem der Domänenanpassung, dass Ihre Eingabe in einer anderen Domäne als vortrainierte Corenlp-Modelle ist.

Der einfachste Weg, um dieses Problem anzugehen, ist, Ihre Eingabe vor der Verwendung von Stanford Corenlp zu normalisieren (wie mit Twitter Normalizer z. B. http://www.cs.cmu.edu/~ark/TweetNLP/). Normalisierung kann ein wenig helfen, aber das Problem nicht vollständig lösen.

Wenn Sie mehr Ressourcen und Geld haben, können Sie Crowdsourcing verwenden, um Ihre Daten zu etikettieren und Ihr eigenes Modell für diese Aufgabe zu trainieren.