Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
私は gensim を使用していますdoc2vec。doc2vec から語彙サイズを知る効率的な方法があるかどうか知りたいです。総単語数を数えるのも大まかな方法ですが、データが膨大な場合 (1GB 以上) は効率的ではありません。
doc2vec
gensim バージョン 4 の更新。語彙サイズは次のように設定できます。
vocab_len = len(model.wv) #
このGensim 4.0への移行ページを参照してください