RパッケージのopenNLPで名詞+名詞または(adj|名詞)+名詞を抽出できるか問い合わせたいのですが?やり方を教えていただけますか?どうもありがとう。
回答ありがとうございます。コードは次のとおりです。
library("openNLP")
acq <- "Gulf Applied Technologies Inc said it sold its subsidiaries engaged in
pipeline and terminal operations for 12.2 mln dlrs. The company said
the sale is subject to certain post closing adjustments,
which it did not explain. Reuter."
acqTag <- tagPOS(acq)
acqTagSplit = strsplit(acqTag," ")
acqTagSplit
qq = 0
tag = 0
for (i in 1:length(acqTagSplit[[1]])){
qq[i] <-strsplit(acqTagSplit[[1]][i],'/')
tag[i] = qq[i][[1]][2]
}
index = 0
k = 0
for (i in 1:(length(acqTagSplit[[1]])-1)) {
if ((tag[i] == "NN" && tag[i+1] == "NN") |
(tag[i] == "NNS" && tag[i+1] == "NNS") |
(tag[i] == "NNS" && tag[i+1] == "NN") |
(tag[i] == "NN" && tag[i+1] == "NNS") |
(tag[i] == "JJ" && tag[i+1] == "NN") |
(tag[i] == "JJ" && tag[i+1] == "NNS"))
{
k = k +1
index[k] = i
}
}
index
リーダーは、 acqTagSplitのインデックスを参照して、名詞 + 名詞または (adj|名詞) + 名詞の抽出を行うことができます。(コードは最適ではありませんが動作します。何かアイデアがあれば教えてください。)
さらに、私にはまだ問題があります。
Justeson と Katz (1995) は、名詞句の候補を抽出する別の言語フィルタリングを提案しました。
((Adj|名詞)+|((Adj|名詞) (名詞-プレップ)?)(Adj|名詞) )名詞
その意味がよく理解できません。それを説明するか、そのような表現をR言語に変換してください。どうもありがとう。