Java Web アプリケーションを使用して、テキスト ファイルとして保存されたニュース データからキーワードを抽出する必要があります。このテキスト マイニング (Renjin Web サイトのパッケージ tm) を実行し、キーワードを抽出するために、Language R と Renjin を使用しています。スクリプトは RStudio で実際に動作しますが、私の Java Web アプリで Renjin を使用して実行することはできません。コーパスを作成しようとすると、この例外が発生します。解決策を教えてください。
org.renjin.eval.EvalException: 名前空間 org.renjin:tools に '.get_internal_S3_generics' という名前のシンボルがありません
txt ファイルを読み取り、キーワードとその頻度を csv ファイルに書き込む私の R スクリプト ファイルを以下に示します。
library(tm)
library(SnowballC)
setwd('/home/lalkrishna/Desktop/keywordtest/')
newsfile <- scan(file = "0e3cdf1b-8fa4-4df0-8977-906d5865008b.txt",what = character() )
news_Corpus <- Corpus(VectorSource(newsfile))
news_Corpus <- tm_map(news_Corpus, removePunctuation)
news_Corpus <- tm_map(news_Corpus, removeNumbers)
news_Corpus <- tm_map(news_Corpus, tolower)
new_stopwords = scan("/home/lalkrishna/Desktop/keywordtest/stop-wordlist.csv", what = character())
updated_stopword_list = c(stopwords("english"),new_stopwords)
news_Corpus <- tm_map(news_Corpus, removeWords, updated_stopword_list)
news_Corpus <- tm_map(news_Corpus, stemDocument)
news_Corpus <- tm_map(news_Corpus, stripWhitespace)
news_Corpus <- tm_map(news_Corpus, PlainTextDocument)
dtm <- DocumentTermMatrix(news_Corpus)
tdm <- TermDocumentMatrix(news_Corpus)
freqs <- as.data.frame(inspect(dtm))
colSums(freqs)
which(apply(tdm, 1, sum) > 2)
write.csv(colSums(freqs), file = "term-freq.csv")