gensim's lda
モデルを使用しようとしています。特定のコーパスで LDA モデルを作成し、最初のコーパスにない単語を含む新しいコーパスで更新したい場合、どうすればよいですか? を呼び出そうとするとlda_model.update(new_corpus)
、次のエラーが発生します。
/Library/Python/2.7/site-packages/gensim/models/ldamodel.pyc in inference(self, chunk, collect_sstats)
361 Elogthetad = Elogtheta[d, :]
362 expElogthetad = expElogtheta[d, :]
-->363 expElogbetad = self.expElogbeta[:, ids]
364
365 # The optimal phi_{dwk} is proportional to expElogthetad_k * expElogbetad_w.
IndexError: index 57 is out of bounds for axis 1 with size 57
わずか 57 語で構成されるコーパスを使用して lda_model を初期化したため、サイズが制限されていることがわかります57
。次に、さらに多くの単語のコーパスを使用して更新を呼び出したかったのですが、これは失敗します。
どうすればこれを回避できますか? 新しい単語を含む新しいコーパスで自分の LDA モデルを更新できるようにしたいのですが、これは可能ですか?