parsing - スタンフォードツールを使用して、普遍的な依存関係を持つフランス語を解析する

Question

Stanford Parser バージョン 3.7.0 (最後のバージョン) を使用して、Universal Dependencies でフランス語のテキストを解析したいと考えています。

これが私のコマンドです：

"java -mx2100m -cp stanford-parser.jar:stanford-french-corenlp-2016-10-31-models.jar edu.stanford.nlp.parser.lexparser.LexicalizedParser -MAX_ITEMS 5000000 -encoding utf-8 -outputFormat conll2007 -outputFormatOptions includePunctuationDependencies -sentences newline frenchFactored.ser.gz "+startinDir+"/"+fic+" > "+startinDir+"/Parses_FR/"+fic_name

利用可能な最後のモデルを使用しますhttps://nlp.stanford.edu/software/lex-parser.shtml#Download

しかし、私の出力には関数が含まれておらず、POS は UD のものではありません

1 ラ _ DD _ 2 ヌル _ _

2 pluie _ NN _ 3 NULL _ _

3 バット _ VV _ 0 ルート _ _

4 レ _ DD _ 5 NULL _ _

5 カロー _ NN _ 3 NULL _ _

CoreNLP のパーサーツールも使用しようとしています。これが私のコマンドラインです。

java -mx1g -cp stanford-corenlp-3.7.0.jar:stanford-french-corenlp-2016-10-31-models.jar edu.stanford.nlp.pipeline.StanfordCoreNLP -props StanfordCoreNLP-french.properties -annotators tokenize,ssplit,pos,depparse -file /Users/Rafael/Desktop/LANGAGES/CORPUS/Sentences_FR/3aube_schtrouFR30.txt -outputFormat sortie.txt

私のプロパティファイルには次の行が含まれています：

annotators = tokenize、ssplit、pos、parse

tokenize.language = fr

parse.model = edu/スタンフォード/nlp/models/lexparser/frenchFactored.ser.gz

pos.model = edu/stanford/nlp/models/pos-tagger/フランス語/フランス語.tagger

depparse.model = edu/stanford/nlp/models/parser/nndep/UD_French.gz depparse.language = フランス語

次のエラーメッセージが表示されます

原因: java.io.IOException: Unable to open "edu/stanford/nlp/models/pos-tagger/french/french.tagger" as class path, filename or URL

どうすれば修正できますか？

parsing - スタンフォード ツールを使用して、普遍的な依存関係を持つフランス語を解析する

0 に答える 0

Related

Reference

parsing - スタンフォードツールを使用して、普遍的な依存関係を持つフランス語を解析する