5

Ich bin auf der Suche nach einer Bibliothek, die Textanalyse und extrahieren Entitäten.Entity Extraction Library

Der Typ/die Klassifikation einer Entität ist nicht kritisch, es ist die Identifizierung von etwas, das sich lohnt, das kritisch ist. Das Entitätsuniversum ist in diesem Fall unendlich, es ist nicht durch ein festgelegtes Wörterbuch begrenzt.

Es scheint, dass es ein paar Webdienste gibt, die das tun (NERD lässt Sie die Ergebnisse dieser Webdienste vergleichen: http://nerd.eurecom.fr/documentation was sehr nützlich ist), aber ich suche nach einer lokalen Bibliothek und nicht remote gehostet Bedienung. Ich würde Java oder .NET bevorzugen, aber wenn es eine gute Bibliothek ist, werde ich lernen, welche Sprache es in geschrieben ist.

Es gibt einige ältere Themen zu ähnlichen Thema und ich hoffte, neue Entwicklung in diesem Bereich zu finden, und

Kennt jemand eine gute Bibliothek, die einen anständigen Job macht?

Antwort

3

Ich habe recherchiert, aber nie die folgenden gehosteten Einheits-Identifizierungsdienste verwendet:

OpenCalais

AlchemyAPI

+0

Die Frage wurde aktualisiert, um zu markieren, dass ich nach einer lokalen Bibliothek und nicht nach einem remote gehosteten Dienst suche. – hi1869695

0

Sie könnten NLTK und Python verwenden. Ein Beispiel für die Verwendung von NLTK für NER finden Sie unter this question.