1

レマタイザーを使用しwordnetて単語をレンマタイズしたいと思いますa

> a<-c("He saw a see-saw on a sea shore", "she is feeling cold")
> a
[1] "He saw a see-saw on a sea shore" "she is feeling cold"  

コーパスに変換aし、前処理手順 (ストップワードの削除、見出し語化など) を行います。

> a <- Corpus(VectorSource(a))

以下の方法で見出し語化を行いたかったのですが、

> filter <- getTermFilter("ExactMatchFilter", a, TRUE)
> terms <- getIndexTerms("NOUN", 1, filter)
> sapply(terms, getLemma)

しかし、私はこのエラーが発生します

> filter <- getTermFilter("ExactMatchFilter", a, TRUE)
Error in .jnew(paste("com.nexagis.jawbone.filter", type, sep = "."), word,  : 
  java.lang.NoSuchMethodError: <init>

私のアイデアは、単一の単語ではなく、コーパス全体を見出し語にすることです。どうすれば達成できますか?

4

1 に答える 1

4

コードをループに入れて、次のようなことを試すことができます。

       lapply(a,function(x){
            x.filter <- getTermFilter("ExactMatchFilter", x, TRUE))
            terms <- getIndexTerms("NOUN", 1, x.filter)
            sapply(terms, getLemma)
         })
于 2013-02-19T10:45:16.507 に答える