次のコードは、単純な比較クラウドを生成します。
library(tm)
library(wordcloud)
text1<- "cat cat dog dog dog bird bird bird bird bike bike bike"
text2<- "cat cat dog dog dog dog fish fish fish fish car car"
tmpText <- data.frame(c(text1, text2))
row.names(tmpText)<- c("text1", "text2")
ds <- DataframeSource(tmpText)
corp <- Corpus(ds)
corp <- tm_map(corp, PlainTextDocument)
corp <- tm_map(corp, content_transformer(tolower))
corp<- tm_map(corp, removePunctuation)
tm <- TermDocumentMatrix(corp)
tm<- as.matrix(tm)
colnames(tm) <- c("text1", "text2")
comparison.cloud(tm, , scale=c(5, 1))
2 つの質問があります。
1- 2 つの単語が複数のドキュメントで同じ頻度を持っている場合、パッケージがそれを 1 つのサブクラウド VS 他のサブクラウドに表示することをどのように決定するか
2- ドキュメントによると、「各単語 ... その角度位置は、その最大値が発生するドキュメントによって決定されます。」シードなしで比較クラウドを複数回実行しましたが、解釈を理解できませんでした。Google で説明を検索しましたが、あまり見つかりませんでした。このコンテキスト内で「角度位置」とはどういう意味ですか?
助けていただければ幸いです
MJJ
