topicmodels パッケージを使用して LDA を実行しています。
lda.model = LDA(dtm, k,control = list(em = list(iter.max = 1000, tol = 10^-4)))
apps.terms<-terms(lda.model,15)
head(apps.terms)
Topic.1 Topic.2 Topic.3 Topic.4 Topic.5
1 38 55 187 38 38
2 40 38 171 40 35
3 55 35 178 56 44
4 49 49 74 35 55
5 35 44 177 190 52
6 44 53 80 55 49
これらのコードは、15 項をその割合で並べ替えます。LDAアルゴリズムをよく理解していなければ。各トピックは用語の分布です。したがって、これらの用語の正確な分布を知りたいです。例えば。Topic.1 は 38 に 30%、40 に 20% などです。topicmodels
パッケージを使用して取得する方法はありますか?