Twitter データを取得してワードクラウドを作成しようとしていますが、TermDocumentMatrix の作成中にコードでエラーが発生しています。私のコードは以下の通りです
twitter_search_data <- searchTwitter(searchString = text_to_search
,n = 500)
twitter_search_text <- sapply(twitter_search_data
,function(x) x$getText())
twitter_search_corpus <- Corpus(VectorSource(twitter_search_text))
twitter_search_corpus <- tm_map(twitter_search_corpus, stripWhitespace, lazy = TRUE)
twitter_search_corpus <- tm_map(twitter_search_corpus, content_transformer(tolower), lazy = TRUE)
twitter_search_corpus <- tm_map(twitter_search_corpus, PlainTextDocument,lazy = TRUE)
twitter_search_corpus <- tm_map(twitter_search_corpus, removePunctuation, lazy = TRUE)
twitter_search_corpus <- tm_map(twitter_search_corpus, removeNumbers, lazy = TRUE)
twitter_search_corpus <- tm_map(twitter_search_corpus, removeWords, c("the", "this", "The", "This", stopwords('english')), lazy = TRUE)
twitter_search_corpus <- tm_map(twitter_search_corpus, stemDocument, lazy = TRUE)
# Create Document Term Matrix
tdm <- as.matrix(TermDocumentMatrix(twitter_search_corpus
,control=list(wordLengths=c(3,Inf))
))
TermDocumentMatrix を作成する前にエラーはありません。私が得るエラーは以下の通りです
mclapply(x$content[i], function(d) tm_reduce(d, x$lazy$maps)) での警告: スケジュールされたコア 1 でユーザー コードでエラーが発生しました。ジョブのすべての値が影響を受けます mclapply(unname( content(x)), termFreq, control) : スケジュールされたコア 1 でユーザー コードでエラーが発生しました。ジョブのすべての値が影響を受けます警告: UseMethod のエラー: クラス「try-エラー」スタック トレース (最も内側から): 74: FUN
73: lapply
72: setNames
71: as.list.VCorpus
70: as.list
69: lapply
68: meta.VCorpus
67: meta
66: TermDocumentMatrix.VCorpus
65: TermDocumentMatrix
64 : as.matrix
63:observeEventHandler
1:runApp
すでに追加lazy = TRUE
しましcontent_transformer(tolower)
たが、それでもエラーが発生します。