2

Ich habe ein Wörterbuch der benannten Einheiten, aus Wikipedia extrahiert. Ich möchte es als das Wörterbuch eines NER verwenden. Ich wollte wissen, wie ich Stanford-NER mit meinen Daten nutzen kann. Ich habe auch Lingpipe heruntergeladen, obwohl ich keine Ahnung habe, wie ich es benutzen kann. Ich würde alle Arten von Informationen schätzen.Exact Dictionary basierte Named Entity Recognition mit Stanford

Danke für Ihre Hilfe.

+0

LingPipe hat eine NE-Tutorial hier, die umfasst regex, exact und statistical named entity extraction: http://alias-i.com/lingpipe/demos/tutorial/ne/read-me.html Es ist eine server-orientierte Java-API mit Demos, wie man von der Kommandozeile aus läuft im Tutorial. –

Antwort

3

Sie können die benannte Entity-Erkennung mit Dictionary (oder regulärem Ausdruck) mit Stanford CoreNLP verwenden. Siehe RegexNER annotator. Für einige Anwendungen führen wir dies mit ziemlich großen Wörterbüchern von Entitäten aus. Dennoch ist dies für uns in der Regel ein sekundäres Werkzeug zur Verwendung statistischer (CRF-basierter) NER.

1

Stanford-NER basiert auf CRFs, was ein statistisches Modell ist. Ich befürchte, dass es kein zusätzliches Wörterbuch oder Lexikon unterstützt. Sie können jedoch ein neues Modell entsprechend Ihrer eigenen Aufgabe trainieren.

+0

Danke @Friedmannn. Ich habe ein wenig über Stanford NER gelesen und herausgefunden, wie es funktioniert. Ich habe auch versucht, seine Gazette zu verwenden, war aber nicht hilfreich. Ich wechselte zu LingPipe und das funktioniert gut. – Hedieh