1

text_corpus で gensim を使用して LDA モデルをトレーニングしました。

>lda_model = gensim.models.ldamodel.LdaModel(text_corpus, 10)

新しいテキスト ドキュメント text_sparse_vector を推論する必要がある場合は、私がしなければなりません

>lda_model[text_sparse_vector]
[(0, 0.036479568280206563), (3, 0.053828073308160099), (7, 0.021936618544365804), (11, 0.017499953446152686), (15, 0.010153090454090822), (16, 0.35967516223499041), (19, 0.098570351997275749), (26, 0.068550060242800928), (27, 0.08371562828754453), (28, 0.14110945630261607), (29, 0.089938130046832571)]

しかし、対応する各トピックの単語分布を取得するにはどうすればよいですか。たとえば、トピック番号 16 の上位 20 語を知るにはどうすればよいですか?

クラスgensim.models.ldamodel.LdaModelにはshow_topics(topics = 10、topn = 10、log = False、formatted = True)というメソッドがありますが、ドキュメントに記載されているように、ランダムに選択されたトピックのリストが表示されます。

リンクまたは印刷する方法はありますか? 推測されたトピック番号を単語分布にマップできますか?

4

3 に答える 3

6
lda.print_topic(x, topn=20) 

トピックxの上位20の機能を取得します

于 2013-01-30T22:38:00.603 に答える