1
dtm <- DocumentTermMatrix(reuters, control=list(wordLengths=c(1,Inf)))

私は dtm を用語 - 用語マトリックスに変換することを考えています。以下は正しくありません:

dtm <- dtm %*% t(dtm)

どのようにすればよいでしょうか?

4

3 に答える 3

2

文書用語マトリックスの構造を正しく理解していれば、それはt(dtm) %*% dtmです。この回答を参照してください。

于 2012-07-21T21:43:29.843 に答える
0
TDM <- TermDocumentMatrix(x) # Form a Term document matrix

termDocMatrix <- as.matrix(TDM) # convert your TDM into a matrix

termDocMatrix[termDocMatrix>=1] <- 1    # change the TDM into Boolean matrix

# term adjacency matrix
termMatrix <- termDocMatrix %*% t(termDocMatrix)


termMatrix[1:10,1:10]  # inspect terms numbered 1 to 10
于 2016-08-27T17:18:31.913 に答える