Stanford Parser バージョン 3.7.0 (最後のバージョン) を使用して、Universal Dependencies でフランス語のテキストを解析したいと考えています。
これが私のコマンドです:
"java -mx2100m -cp stanford-parser.jar:stanford-french-corenlp-2016-10-31-models.jar edu.stanford.nlp.parser.lexparser.LexicalizedParser -MAX_ITEMS 5000000 -encoding utf-8 -outputFormat conll2007 -outputFormatOptions includePunctuationDependencies -sentences newline frenchFactored.ser.gz "+startinDir+"/"+fic+" > "+startinDir+"/Parses_FR/"+fic_name
利用可能な最後のモデルを使用しますhttps://nlp.stanford.edu/software/lex-parser.shtml#Download
しかし、私の出力には関数が含まれておらず、POS は UD のものではありません
1 ラ _ DD _ 2 ヌル _ _
2 pluie _ NN _ 3 NULL _ _
3 バット _ VV _ 0 ルート _ _
4 レ _ DD _ 5 NULL _ _
5 カロー _ NN _ 3 NULL _ _
CoreNLP のパーサー ツールも使用しようとしています。これが私のコマンドラインです。
java -mx1g -cp stanford-corenlp-3.7.0.jar:stanford-french-corenlp-2016-10-31-models.jar edu.stanford.nlp.pipeline.StanfordCoreNLP -props StanfordCoreNLP-french.properties -annotators tokenize,ssplit,pos,depparse -file /Users/Rafael/Desktop/LANGAGES/CORPUS/Sentences_FR/3aube_schtrouFR30.txt -outputFormat sortie.txt
私のプロパティファイルには次の行が含まれています:
annotators = tokenize、ssplit、pos、parse
tokenize.language = fr
parse.model = edu/スタンフォード/nlp/models/lexparser/frenchFactored.ser.gz
pos.model = edu/stanford/nlp/models/pos-tagger/フランス語/フランス語.tagger
depparse.model = edu/stanford/nlp/models/parser/nndep/UD_French.gz depparse.language = フランス語
次のエラー メッセージが表示されます
原因: java.io.IOException: Unable to open "edu/stanford/nlp/models/pos-tagger/french/french.tagger" as class path, filename or URL
どうすれば修正できますか?