Distributed Bag of Words (DBOW) を使用していますが、1 つのエポックで何が起こるのか知りたいですか? DBOW はすべてのドキュメント (別名バッチ) を循環しますか、それともドキュメントのサブセット (別名ミニバッチ) を循環しますか? さらに、特定のドキュメントに対して、DBOW はテキスト ウィンドウから単語をランダムにサンプリングし、重みを学習してそのターゲット単語をウィンドウ内の周囲の単語に関連付けます。これは、DBOW がドキュメント内のすべてのテキストを処理しない可能性があることを意味しますか?
GENSIM ( https://github.com/RaRe-Technologies/gensim ) コードを調べて、バッチのパラメーターがあるかどうかを確認しましたが、うまくいきませんでした。