java - Java プログラムにスタンフォードパーサーソフトウェアを統合するにはどうすればよいですか?

Question

スタンフォードパーサーを使用して文を分離し、文内の単語間の関係を示すグラフを生成するプロジェクトを Java で開発する必要があります。例: オハイオ州はアメリカにあります。出力：

画像はグラフを示しています。ただし、出力は同じである必要はありませんが、単語間の関係をグラフ形式で示す必要があります。グラフは、Jgraph、Jung を使用して生成できます。しかし、最初はパーサーソフトウェアをプログラムに統合する必要があります。では、どうすればパーサーを統合できますか??

score 13 · Accepted Answer

スタンフォードパーサーの zipをダウンロードします。
プロジェクトのビルドパスにjarを追加します (モデルファイルを含めます)。

次のスニペットを使用して文を解析し、構成要素ツリーを返します: (依存関係ツリーは、ツリーの構造を調べることで構築できます)

import java.io.StringReader;
import java.util.List;

import edu.stanford.nlp.ling.CoreLabel;
import edu.stanford.nlp.process.TokenizerFactory;
import edu.stanford.nlp.parser.lexparser.LexicalizedParser;
import edu.stanford.nlp.process.CoreLabelTokenFactory;
import edu.stanford.nlp.process.PTBTokenizer;
import edu.stanford.nlp.process.Tokenizer;
import edu.stanford.nlp.trees.Tree;

class Parser {

    private final static String PCG_MODEL = "edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz";        

    private final TokenizerFactory<CoreLabel> tokenizerFactory = PTBTokenizer.factory(new CoreLabelTokenFactory(), "invertible=true");

    private final LexicalizedParser parser = LexicalizedParser.loadModel(PCG_MODEL);

    public Tree parse(String str) {                
        List<CoreLabel> tokens = tokenize(str);
        Tree tree = parser.apply(tokens);
        return tree;
    }

    private List<CoreLabel> tokenize(String str) {
        Tokenizer<CoreLabel> tokenizer =
            tokenizerFactory.getTokenizer(
                new StringReader(str));    
        return tokenizer.tokenize();
    }

    public static void main(String[] args) { 
        String str = "My dog also likes eating sausage.";
        Parser parser = new Parser(); 
        Tree tree = parser.parse(str);  

        List<Tree> leaves = tree.getLeaves();
        // Print words and Pos Tags
        for (Tree leaf : leaves) { 
            Tree parent = leaf.parent(tree);
            System.out.print(leaf.label().value() + "-" + parent.label().value() + " ");
        }
        System.out.println();               
    }
}

java - Java プログラムにスタンフォード パーサー ソフトウェアを統合するにはどうすればよいですか?

1 に答える 1

Related

Reference

java - Java プログラムにスタンフォードパーサーソフトウェアを統合するにはどうすればよいですか?