Ich muss Koreferenzen auflösen, aber der Eingabetext wird aus einer Chat-Konversation extrahiert, sodass die Genauigkeit des Tools (Stanford Corenlp), das derzeit verwendet wird, aufgrund des Dialogs zwischen zwei Personen gering ist.Wie kann die Genauigkeit der Koreferenzauflösung für eine Chat-Konversation erhöht werden?
0
A
Antwort
0
Dies ist ein Problem der Domänenanpassung, dass Ihre Eingabe in einer anderen Domäne als vortrainierte Corenlp-Modelle ist.
Der einfachste Weg, um dieses Problem anzugehen, ist, Ihre Eingabe vor der Verwendung von Stanford Corenlp zu normalisieren (wie mit Twitter Normalizer z. B. http://www.cs.cmu.edu/~ark/TweetNLP/). Normalisierung kann ein wenig helfen, aber das Problem nicht vollständig lösen.
Wenn Sie mehr Ressourcen und Geld haben, können Sie Crowdsourcing verwenden, um Ihre Daten zu etikettieren und Ihr eigenes Modell für diese Aufgabe zu trainieren.