7

私は gensim を使用していますdoc2vec。doc2vec から語彙サイズを知る効率的な方法があるかどうか知りたいです。総単語数を数えるのも大まかな方法​​ですが、データが膨大な場合 (1GB 以上) は効率的ではありません。

4

3 に答える 3

0

gensim バージョン 4 の更新。語彙サイズは次のように設定できます。

vocab_len = len(model.wv)  # 

このGensim 4.0への移行ページを参照してください

于 2021-11-20T15:54:39.003 に答える