分類タスクにgenism doc2vecモデルを使用したいと思います。ただし、doc2vec の gensim 実装では、モデルをトレーニングする前に語彙を構築するためにすべてのドキュメント (トレーニングとテスト) を確認する必要があるようです。それ以外の場合、ボキャブラリの構築時に存在しなかったドキュメントのドキュメント ベクトルを取得しようとすると、keyerror が発生します。私の理解は正しいのだろうか!実際には、トレーニング時にテスト データにアクセスすることはできません。
テスト文書の文書表現を取得できるように、テスト時に語彙を更新する方法はありますか?