1

ツリー構造から名詞句を抽出する必要がありますが、正規表現パターンを使用してツリー構造から名詞を抽出できません。

これがツリー構造です

(TOP (ADJP (JJ ウェルカム) (PP (TO to) (NP (NNP レギュラー) (NNP Expression) (NNS learnings))))))

NP、NNP、NNS などの pos タグであるすべての単語を抽出する必要があります。正規表現パターンを使用して、Regular、Expression、learnings などの単語を取得する必要があります。

これを取得する方法を教えてください。

4

1 に答える 1

1

これがあなたが望んでいたものであるかどうかはわかりませんが、これはあなたのためにそれらの単語を抽出します:

Pattern regexpPattern = Pattern.compile("([A-Z]?[a-z]+)\\)");
Matcher m = regexpPattern.matcher("your string");
while (m.find()) {
    System.out.println(m.group(1));
}
于 2013-02-21T11:43:40.873 に答える