私は自然言語処理の初心者です.テキストから名詞句を抽出する必要があります.これまでのところ、テキストを解析してツリー構造を取得するためにopen nlpのチャンキングパーサーを使用しました.しかし、私はから名詞句を抽出することができません.ツリー構造、開いている nlp に正規表現パターンがあるので、それを使用して名詞句を抽出できます。
以下は私が使用しているコードです
InputStream is = new FileInputStream("en-parser-chunking.bin");
ParserModel model = new ParserModel(is);
Parser parser = ParserFactory.create(model);
Parse topParses[] = ParserTool.parseLine(line, parser, 1);
for (Parse p : topParses){
p.show();}
ここで、出力を次のように取得しています
(TOP (S (S (ADJP (JJ ウェルカム)) (PP (TO to) (NP (NNP Big) (NNP Data.))))) (S (NP (PRP We)) (VP (VP (VBP are) (VP (VBG working) (PP (IN on) (NP (NNP Natural) (NNP Language) (NNP Processing.can))))) (NP (DT some) (CD one) (NN help)) (NP ( PRP us)) (PP (IN in) (S (VP (VBG 抽出) (NP (DT the) (NN 名詞) (NNS 句))) (PP (IN from) (NP (DT the) (NN tree)) ( WP構造。))))))))))
NP、NNP、NN などの名詞句を取得するのを手伝ってもらえますか?
これについて私を助けてください。
前もって感謝します
ガセ。