全て、
これは、このスレッドで回答した内容の再投稿です。gensim で LSI トピックを印刷しようとすると、まったくおかしな結果が得られます。これが私のコードです:
try:
from gensim import corpora, models
except ImportError as err:
print err
class LSI:
def topics(self, corpus):
tfidf = models.TfidfModel(corpus)
corpus_tfidf = tfidf[corpus]
dictionary = corpora.Dictionary(corpus)
lsi = models.LsiModel(corpus_tfidf, id2word=dictionary, num_topics=5)
print lsi.show_topics()
if __name__ == '__main__':
data = '../data/data.txt'
corpus = corpora.textcorpus.TextCorpus(data)
LSI().topics(corpus)
これにより、以下がコンソールに出力されます。
-0.804*"(5, 1)" + -0.246*"(856, 1)" + -0.227*"(145, 1)" + ......
@2er0 がここで行ったようにトピックを印刷できるようにしたいのですが、このような結果が得られています。以下を参照してください。出力された 2 番目の項目はタプルであり、どこから来たのかわからないことに注意してください。data.txt は、いくつかの段落を含むテキスト ファイルです。それだけです。
これについての考えは素晴らしいでしょう!アダム