1

doc2vecfunctionには、 というパラメーターがありますsize

sizeは出力ベクトルの次元でありsize=400、コンテンツをキャプチャする場合は if よりも優れていることを理解していsize=100ます。

しかし、私は理解していません、何sizeの略ですか?次の単語を予測するために、Doc2Vec が単語からどれだけ検索するかということですか? またはそれはどういう意味ですか?

どうもありがとう、

4

1 に答える 1

1

size作成されたベクトルの次元数です。したがってsize=100、各ドキュメント (実際にはドキュメント タグ) がトレーニングから 100 次元のベクトルを受け取ることを意味します。

ディメンションが多いほど良いとは限りません。つまり、トレーニングが遅くなり、モデルが大きくなります。また、小規模なデータセットで作業している場合、ディメンションが多すぎるとオーバーフィッティングのリスクが生じ、モデルがデータ内の一般化可能なパターンを表すことができなくなります。

于 2016-07-29T02:42:25.913 に答える