2010-03-05 8 views
5

Ich habe begonnen, an einem Projekt zu arbeiten, das Natural Language Processing erfordert. Wir haben die Rechtschreibprüfung sowie die Zuordnung von Sätzen zu Phrasen und deren Synonymen durchgeführt. Ich dachte zuerst daran, GATE zu verwenden, aber ich bin verwirrt, was ich verwenden soll? Ich habe hier einen interessanten Beitrag gefunden, der mich noch mehr verwirrt hat.Natural Language Processing-Paket

http://lordpimpington.com/codespeaks/drupal-5.1/?q=node/5

Bitte helfen Sie mir zu entscheiden, was meinen Zweck am besten passt. Ich arbeite an einer Webanwendung, die uns dieses NLP-Tool als Dienstleistung anbietet.

+1

Es gibt nicht so etwas, in einem gewissen Sinne als ‚NLP‘. Es wäre besser, wenn Sie wirklich genau festlegen würden, welche Aufgaben Sie ausführen müssen. – bmargulies

+0

Sehen, was ich im Grunde brauche, ist jede grundlegende Architektur/Werkzeug, das mir helfen würde, an der Einrichtung von Maschinenlernsystemen zu arbeiten. Die Sätze, die als Eingabe eingehen, müssen auf bestimmte Phrasen/Synonyme von Phrasen abgebildet werden, die in dem Satz vorhanden sein können. Welches Gefühl des Satzes entspricht welcher der von mir aufgestellten Sätze. – Arc

+2

Sieht aus wie ein Duplikat von http://stackoverflow.com/questions/2061881/natural-language-parsing-tools-what-is-out-there-and-what-is-not zu mir. –

Antwort

6

Sie haben nicht wirklich viele Informationen geben, aber versuchen Sie dies: http://www.nltk.org/

Ich glaube nicht NLTK Überprüfung nicht buchstabieren (ich das falsch sein könnte), aber es kann für Text-Tagging Teile der Sprache tun Eingang.

für das Finden/Synonyme passend Sie so etwas wie WordNet http://wordnet.princeton.edu/

verwenden könnte Wenn Sie etwas wirklich domänenspezifische tun: würde ich bestimmte Begriffe kommen mit Ihrem eigenen Ontologie für Domain empfehlen.

+0

Es gibt mehrere Domänen, für die die Analyse durchgeführt werden muss. Was würden Sie in einem solchen Fall vorschlagen? Für eine grundlegende Einrichtung kann ich verwenden. So etwas wie ein TOR .. Wie nützlich kann es sein? – Arc

+0

Es hängt davon ab, wie genau sie einer gegebenen Ontologie (wie WordNet) entsprechen. Wenn Sie die meisten Begriffe auf die gleiche Weise wie eine vordefinierte Ontologie verwenden, müssen Sie nicht selbst rollen. Wenn Sie die gleichen Begriffe auf unterschiedliche Weise verwenden, müssen Sie möglicherweise einen neuen erstellen. Wenn Sie mehrere Domains verwenden, die Begriffe auf unterschiedliche Weise verwenden, müssen Sie möglicherweise mehrere Domains erstellen. – adam

3

Wenn Sie Python verwenden, können Sie eine Rechtschreibprüfung mit Python Enchant entwickeln. NLTK ist auch gut für die Entwicklung von Sentiment Analysis System. Ich habe einige Prototypen der gleichen zu

Jaggu