Stanford Neural Network Dependency Parser をトレーニングして、フレーズの類似性をチェックしようとしています。
私が試した方法は次のとおりです。
java edu.stanford.nlp.parser.nndep.DependencyParser -trainFile trainPath -devFile devPath -embedFile wordEmbeddingFile -embeddingSize wordEmbeddingDimensionality -model modelOutputFile.txt.gz
私が得たエラーは次のとおりです。
Train File: C:\Users\rohit\Downloads\CoreNLP-master\CoreNLP-master\data\edu\stanford\nlp\parser\trees\en-onetree.txt
Dev File: null
Model File: modelOutputFile.txt.gz
Embedding File: null
Pre-trained Model File: null
################### Train
#Trees: 1
0 tree(s) are illegal (0.00%).
1 tree(s) are legal but have multiple roots (100.00%).
0 tree(s) are legal but not projective (0.00%).
###################
#Word: 3
#POS:3
#Label: 2
###################
#Transitions: 3
#Labels: 1
ROOTLABEL: null
Random generator initialized with seed 1459831358061
Exception in thread "main" java.lang.NullPointerException
at edu.stanford.nlp.parser.nndep.Util.scaling(Util.java:49)
at edu.stanford.nlp.parser.nndep.DependencyParser.readEmbedFile. (DependencyParser.java:636)
at edu.stanford.nlp.parser.nndep.DependencyParser.setupClassifierForTraining(DependencyParser.java:787)
at edu.stanford.nlp.parser.nndep.DependencyParser.train(DependencyParser.java:676)
at edu.stanford.nlp.parser.nndep.DependencyParser.main(DependencyParser.java:1247)
コードに組み込まれているヘルプには、トレーニング ファイルは「CoNLL-X 形式のトレーニング ツリーバンクへのパス」である必要があると記載されています。
トレーニングする CoNLL-X トレーニング データがどこにあるか知っている人はいますか? トレーニング ファイルを指定しましたが、埋め込みファイルを指定しなかったため、このエラーが発生しました。私の推測では、埋め込みファイルを渡せばうまくいくかもしれません。
どのトレーニング ファイルと埋め込みファイルを使用する必要があるのか、どこでそれらを見つけることができるのかを明らかにしてください。