サイズが 40 MB のテキスト データセットがあり、Word2Vec をトレーニングして、特定のドメインのドキュメント全体で文または段落間の類似性を見つけるために使用できるモデルを構築したいと考えています。Word2Vec が適切な結果を得るために必要なデータセットの最小サイズは?
質問する
1070 次
サイズが 40 MB のテキスト データセットがあり、Word2Vec をトレーニングして、特定のドメインのドキュメント全体で文または段落間の類似性を見つけるために使用できるモデルを構築したいと考えています。Word2Vec が適切な結果を得るために必要なデータセットの最小サイズは?