1

LSI(機械工学のバックグラウンド)についての私の控えめな理解を通して私と一緒に耐えてください:

LSIでSVDを実行すると、次の3つの行列ができます。

U、S、およびVの転置。

Uは単語とトピックを比較し、Sは各機能の強さの一種の尺度です。Vtはトピックとドキュメントを比較します。

 U dot S dot Vt

SVDの前の元のマトリックスを返します。あまり(なし)詳細な代数を実行しないと、次のようになります。

 U dot S dot **Ut**

用語ごとのマトリックスを返します。これは、用語間の比較を提供します。つまり、ある用語が他の用語とどの程度関連しているか、コンポーネントではなく単語を比較する種類のDSM(設計構造マトリックス)です。私は完全に間違っている可能性がありますが、サンプルデータセットで試してみたところ、結果は理にかなっているようでした。しかし、それはバイアスかもしれません(私はそれを機能させたかったので、私が望むものを見ました)。ドキュメントが保護されているため、結果を投稿できません。

私の質問は、これは意味がありますか?論理的に?数学的に?

時間/応答をありがとう。

4

1 に答える 1

0

ある用語が別の用語にどのように関連しているかを知りたい場合は、単に計算できます

(うドットS)

項は行ベクトルで表されます。その後、ユークリッド距離などの距離関数を適用して距離行列を計算できます。すべてのベクトル間の距離を計算して距離行列を作成すると、結果の行列はすべての距離が 0 を超える中空対称になるはずです。距離 A[i,j] が小さい場合、それらは関連しています。そうでない場合は関係ありません。

于 2013-03-04T11:27:54.687 に答える