R で Wordnet の getLemma 関数を使用してコーパスを見出し語化したいのですが、その使用方法がよくわかりません。
これは、R で wordnet パッケージを使用した見出し語化に関するドキュメントです。
filter <- getTermFilter("StartsWithFilter", "car", TRUE)
terms <- getIndexTerms("NOUN", 5, filter)
sapply(terms, getLemma)
私の質問は、5000 語を含むドキュメントがあり、この場合、各単語をそのベース/ルート ワードに変換したいということです。例: 熱 --> 熱 ; 熱中症→熱中症
コーパス内のすべての単語を見出し語化したいのですが、StartingWith... という単語に制限したくありません。数字の 5 の意味もわかりませんterms <- getIndexTerms("NOUN", 5, filter)
誰かが私のためにこれを解決できれば素晴らしいことです。
ありがとう