0

R で Wordnet の getLemma 関数を使用してコーパスを見出し語化したいのですが、その使用方法がよくわかりません。

これは、R で wordnet パッケージを使用した見出し語化に関するドキュメントです。

filter <- getTermFilter("StartsWithFilter", "car", TRUE)
terms <- getIndexTerms("NOUN", 5, filter)
sapply(terms, getLemma) 

私の質問は、5000 語を含むドキュメントがあり、この場合、各単語をそのベース/ルート ワードに変換したいということです。例: 熱 --> 熱 ; 熱中症→熱中症

コーパス内のすべての単語を見出し語化したいのですが、StartingWith... という単語に制限したくありません。数字の 5 の意味もわかりませんterms <- getIndexTerms("NOUN", 5, filter)

誰かが私のためにこれを解決できれば素晴らしいことです。

ありがとう

4

1 に答える 1

0

5 は、必要な結果の最大数である maxLimit を指します... http://cran.r-project.org/web/packages/wordnet/wordnet.pdf <-これには、問題を解決するために必要なすべてが含まれています

于 2013-09-25T15:52:42.513 に答える