2016-08-04 36 views
1

In einer App, die ich entwickle, muss ich wissen, ob eine Wortkette eine Nominalphrase, eine Verbalphrase usw. ist. Ich verstehe, dass NP und VP weder Abhängigkeiten noch POS sind. Ich verstehe auch, dass ich dazu wahrscheinlich ein Chunking-Tool benötige, aber ich konnte keine Open-Source-Tools finden.Verwenden Sie SyntaxNet zum Chunking?

In der Ausgabe von SyntaxNet für den Satz „mag sie wirklich netten schwarzen Hund“:

likes VBZ ROOT 
+-- She PRP nsubj 
+-- really RB advmod 
+-- dog NN dobj 
    +-- cute JJ amod 
    +-- black JJ amor 

Ich bemerkte, dass die NP „cute schwarzer Hund“ in seinem eigenen Baumknoten wurde gesagt:

+-- dog NN dobj 
    +-- cute JJ amod 
    +-- black JJ amor 

Also frage ich mich, ob ich überhaupt SyntaxNet als Chunker verwenden kann?

+0

Ein * Wahlkreis * Parser wird Ihnen sagen, ob Sie einen NP, VP usw. haben. – reynoldsnlp

Antwort

1

Ehrlich gesagt, gibt es genaue schnelle Chunkers (wie NLTK) da draußen, dass ich nicht sehe, warum Abhängigkeiten Parse Bäume verwenden, um Chunks zu extrahieren.

Obwohl Sie this google sample code (dies bietet keine Brocken, sondern Subjekt, Objekt und Verb), die für Ihre Anwendung nützlich sein können, und geben Sie einige Hinweise, wie definieren Regexs die meisten Nominalphrasen zu extrahieren.