4

gensim's ldaモデルを使用しようとしています。特定のコーパスで LDA モデルを作成し、最初のコーパスにない単語を含む新しいコーパスで更新したい場合、どうすればよいですか? を呼び出そうとするとlda_model.update(new_corpus)、次のエラーが発生します。

/Library/Python/2.7/site-packages/gensim/models/ldamodel.pyc in inference(self, chunk, collect_sstats)
    361             Elogthetad = Elogtheta[d, :]
    362             expElogthetad = expElogtheta[d, :]
 -->363             expElogbetad = self.expElogbeta[:, ids]
    364 
    365             # The optimal phi_{dwk} is proportional to expElogthetad_k * expElogbetad_w.
   IndexError: index 57 is out of bounds for axis 1 with size 57

わずか 57 語で構成されるコーパスを使用して lda_model を初期化したため、サイズが制限されていることがわかります57。次に、さらに多くの単語のコーパスを使用して更新を呼び出したかったのですが、これは失敗します。

どうすればこれを回避できますか? 新しい単語を含む新しいコーパスで自分の LDA モデルを更新できるようにしたいのですが、これは可能ですか?

4

1 に答える 1