5

状況:

[[0,1,0,0....],....[......0,0,0,0]] という numpy 用語ドキュメント マトリックスの例があります。

上記のマトリックスを gensim の ldamodel メソッドにプラグインしました。そして、それは若者の方法でうまく機能していlda = LdaModel(corpus, num_topics=10)ます。 corpusは、上記の用語とドキュメントのマトリックスです。研究目的で、2 つの中間行列 (トピックと単語の配列とドキュメントとトピックの配列) が必要でした。

1) ドキュメントトピック確率行列 (p_d_t) ごと

2) トピック単語ごとの確率行列 (p_w_t)

質問:

gensimLdaModel()関数からこれらの配列を取得する方法。それらの行列を取得するのを手伝ってください。

4

1 に答える 1

10

1.ドキュメントごとのトピック確率行列:

コーパスに変換を適用します。

docTopicProbMat = lda[corpus]
  1. トピックごとの単語確率行列:

K = lda.num_topics topicWordProbMat = lda.print_topics(K)

于 2014-09-21T02:45:02.580 に答える