私は特異値分解を学習している最中であり、この概念をどのような目的で使用できるか、そして私が読んでいる本では、SVD が潜在的セマンティック インデックス作成で使用されていると述べています。LSI に関する記事をいくつか読みましたが、LSI は主に検索エンジンや同様のアプリケーションで使用されているようです。私が取り組んでいる小さなデータ分析プロジェクトに LSI を使用したかったのですが、それが私のアプリケーションにとって意味があるかどうかわかりません。これが私が取り組んでいるものです。
約 20000 のゲームのリストがあり、このリストの 2 つの属性は、ゲームのジャンルとゲームがリリースされたプラットフォームです。LSI を使用して、プラットフォームとジャンル属性に関する情報を取得したかったのです。
最初に、行が 24 の異なるジャンルを表し、列が 22 の異なるプラットフォームを表す共起マトリックスを作成しました。次に、共起行列の SVD 分解を行い、U と V の最初の 2 列を抽出し、U と V の 2 次元プロットを作成しました。プロットは次のようになります。
私の質問は、これは潜在的セマンティック インデックス作成の意味のある使用法と見なすことができますか? また、このグラフからどのように解釈できますか? たとえば、ジャンル アクションとプラットフォーム PC は、他のすべての変数から遠く離れていることがわかります。これは、特にこのジャンルとプラットフォームについて何かを教えてくれますか?
ありがとうございました。