Ich versuche, den Stanford Neural Network Dependency Parser zu trainieren, um die Phrasenähnlichkeit zu überprüfen.Woher bekomme ich CoNLL-X Trainingsdaten?
Die Art, wie ich versuchte:
java edu.stanford.nlp.parser.nndep.DependencyParser -trainFile trainPath -devFile devPath -embedFile wordEmbeddingFile -embeddingSize wordEmbeddingDimensionality -model modelOutputFile.txt.gz
Der Fehler, den ich ist bekam:
Train File: C:\Users\rohit\Downloads\CoreNLP-master\CoreNLP-master\data\edu\stanford\nlp\parser\trees\en-onetree.txt
Dev File: null
Model File: modelOutputFile.txt.gz
Embedding File: null
Pre-trained Model File: null
################### Train
#Trees: 1
0 tree(s) are illegal (0.00%).
1 tree(s) are legal but have multiple roots (100.00%).
0 tree(s) are legal but not projective (0.00%).
###################
#Word: 3
#POS:3
#Label: 2
###################
#Transitions: 3
#Labels: 1
ROOTLABEL: null
Random generator initialized with seed 1459831358061
Exception in thread "main" java.lang.NullPointerException
at edu.stanford.nlp.parser.nndep.Util.scaling(Util.java:49)
at edu.stanford.nlp.parser.nndep.DependencyParser.readEmbedFile. (DependencyParser.java:636)
at edu.stanford.nlp.parser.nndep.DependencyParser.setupClassifierForTraining(DependencyParser.java:787)
at edu.stanford.nlp.parser.nndep.DependencyParser.train(DependencyParser.java:676)
at edu.stanford.nlp.parser.nndep.DependencyParser.main(DependencyParser.java:1247)
Die Hilfe im Code eingebettet, so dass die Trainingsdatei ein sein sollte - „Path to a Baumschulbank im CoNLL-X Format ".
Weiß jemand, wo ich einige CoNLL-X Trainingsdaten zum Trainieren finden kann? Ich gab Trainingsdatei, aber nicht die Datei einbetten und bekam diesen Fehler. Meine Vermutung ist, wenn ich die Einbettungsdatei geben könnte, könnte es funktionieren.
Bitte werfen Sie etwas Licht auf die Trainingsdatei & Einbettung Datei, die ich verwenden sollte und wo ich sie finden kann.
Dank @dmcc Ich habe eingebettete Datei weggelassen und Conll Daten gefüttert. Es läuft jetzt. – Aaron