朝からかなりの数のチュートリアルを読みました。私の問題は、2 つのドキュメント間の類似性を見つけることです。この目的のために Java で LSA を使用することを楽しみにしています。
term-document マトリックスの作成を理解してから、SVD(Dimensionality gets Reduce) を適用します。結果として 3 つの行列が取得されます。これはばかげているように聞こえるかもしれませんが、私はかなり長い間これに固執してきました。2 つのドキュメント間の類似性を見つけなければならない場合、どうすればよいですか?