一連の Web ページが与えられ、ページ レコメンダーを作成する必要があります。アプリケーションに指定された URL に関係なく、アプリケーションは指定されたプールから URL のページに類似したページを見つけることができる必要があります。
それを行うためのさまざまなアプローチを探してみました。word2vec の使用に興味がありました。指定されたすべての Web ページ セットをクロールし、そのページのコンテンツに基づいてそのページのタグを生成することを計画しています。これらのタグから、word2vec を使用してページのベクトル値を計算し、保存することを望んでいました。検索するとき、同様の値を探すために、同様の方法で特定のページのベクトルを計算します。これは word2vec を使用する正しい方法ですか? どのトレーニング ベクトルを使用する必要がありますか? このタスクを実行するための他のより良い方法はありますか?または、プレーンテキストの一致がより良いオプションでしょうか?