2 つの非常に大きな行列の固有ベクトルのコサイン類似度を見つけて、それらがどの程度類似しているかを比較することは、有効な尺度ですか?
私は2つの非常に大きな行列AとBを持っています.私は見つけました:
-> 共分散行列 C Aおよび C B、
-> C Aと C Bの上位 20 個の固有ベクトル、
-> 上位 20 個の固有ベクトル間のコサイン類似度。
コサイン値に基づいて、行列 A と B が類似/非類似であると結論付けるのは正しいですか?
2 つの非常に大きな行列の固有ベクトルのコサイン類似度を見つけて、それらがどの程度類似しているかを比較することは、有効な尺度ですか?
私は2つの非常に大きな行列AとBを持っています.私は見つけました:
-> 共分散行列 C Aおよび C B、
-> C Aと C Bの上位 20 個の固有ベクトル、
-> 上位 20 個の固有ベクトル間のコサイン類似度。
コサイン値に基づいて、行列 A と B が類似/非類似であると結論付けるのは正しいですか?
短い答え: いいえ、確かに固有値も考慮する必要があります。
N 行 N 列の正方行列を、N ベクトルを N ベクトルにマッピングする線形演算子と考えると、そのようなベクトル空間での行列の作用は、行列のスペクトル構造全体 (固有ベクトルと関連する固有値) の影響を強く受けます。 .
通常、最大の固有値は、行列がより敏感な N ベクトル空間 (固有ベクトル) の方向を表すため、最も重要です。
良いシナリオでは、大きな行列 (つまり、その固有値のセット) のスペクトルは、いくつかの最大の固有値と多数の小さな固有値にうまく分離できます。この場合、そのような優勢な固有値と関連する固有ベクトルのセットに基づいて、類似性の測度を定義することが可能です。
私自身の経験から例を挙げると、弾性構造のモデリングから生じる行列の場合、これは実際に典型的なケースです。これは、優勢な固有値/固有ベクトルが弾性構造の全体的な特性を「凝縮」するためです。
そうは言っても、特定のケースが病理学的にどれほど悪化するかに制限はありません。それは、検討中の特定の問題に大きく依存します。私の意見では、「行列の類似性」の確信に満ちた仮定は、問題に関する物理的な洞察によって大きく左右されます。
「類似」行列を定義するその他の一般的な基準は、特異値分解(SVD) または主成分分析(PCA) に基づいています。