LSI(機械工学のバックグラウンド)についての私の控えめな理解を通して私と一緒に耐えてください:
LSIでSVDを実行すると、次の3つの行列ができます。
U、S、およびVの転置。
Uは単語とトピックを比較し、Sは各機能の強さの一種の尺度です。Vtはトピックとドキュメントを比較します。
U dot S dot Vt
SVDの前の元のマトリックスを返します。あまり(なし)詳細な代数を実行しないと、次のようになります。
U dot S dot **Ut**
用語ごとのマトリックスを返します。これは、用語間の比較を提供します。つまり、ある用語が他の用語とどの程度関連しているか、コンポーネントではなく単語を比較する種類のDSM(設計構造マトリックス)です。私は完全に間違っている可能性がありますが、サンプルデータセットで試してみたところ、結果は理にかなっているようでした。しかし、それはバイアスかもしれません(私はそれを機能させたかったので、私が望むものを見ました)。ドキュメントが保護されているため、結果を投稿できません。
私の質問は、これは意味がありますか?論理的に?数学的に?
時間/応答をありがとう。