Doc2Vec および Word2Vec 深層学習アルゴリズム ( Gensim の Doc2Vec API の説明) を使用しています。詳しい説明はこちら
model.n_similarity(wordSet1, wordSet2)
現在、基本的に2セットの単語間のコサイン類似度を計算する方法の使用に興味があります。
私はモデルのパフォーマンスを検証する方法に興味があります。n_similiarity()
機能だけでなく、モデルが提供する正確性または現実的な結果が全体的にどの程度かということです。ディープ ラーニングを実行するため、そのパフォーマンスを知る方法があるかどうかはわかりません。
調べてから使用する必要がある手法はありますか、または結果があり、比較する必要があるデータセットはありますか?
どんな提案でも大歓迎です。ありがとうございました。