gensim で Mallet ラッパーのチュートリアルを複製しようとしています。http://radimrehurek.com/2014/03/tutorial-on-mallet-in-python/
モデルをフィットさせると
model = models.LdaMallet(mallet_path, corpus, num_topics=10, id2word=corpus.dictionary)
エラー メッセージが表示されます。
C:\Anaconda\lib\site-packages\gensim\models\ldamallet.py:234: RuntimeWarning: invalid value encountered in divide topic = topic / topic.sum() # normalize to probability dist
モデルを使用して例のトピック分布を推測すると、分布は均一です。
doc = "Don't sell coffee, wheat nor sugar; trade gold, oil and gas instead."
bow = corpus.dictionary.doc2bow(utils.simple_preprocess(doc))
print model[bow]
私の出力:
[(0, 0.10000000000000002), (1, 0.10000000000000002), (2, 0.10000000000000002), (3, 0.10000000000000002), (4, 0.10000000000000002), (5, 0.10000000000000002), (6, 0.10000000000000002), (7, 0.10000000000000002), (8, 0.10000000000000002), (9, 0.10000000000000002)]
これはラッパーまたはマレットの機能に問題がありますか? ここでマレットのチュートリアルを複製することができました: http://programminghistorian.org/lessons/topic-modeling-and-mallet