3

大きな (500k x 500k) 疎行列があります。その主なコンポーネントを取得したいと思います (実際、最大の PC を計算するだけでも問題ありません)。ランダム化された PCA は、相関行列ではなく共分散行列の固有ベクトルを本質的に見つけていることを除いて、うまく機能します。大規模な疎行列の共分散行列を使用して PCA を見つけるパッケージのアイデアはありますか? matlabとRも機能しますが、できればPythonで。

(参考までに、同様の質問がここで尋ねられましたが、方法は共分散行列を参照しています)。

4

2 に答える 2

0

それらは同じものではありませんか?私が理解している限り、相関行列は、各変数の標準偏差の積で正規化された共分散行列にすぎません。そして、私が正しく思い出せば、とにかくPCAにスケーリングのあいまいさはありませんか?

于 2012-11-28T21:28:26.457 に答える
0

R で irlba パッケージを試したことがありますか - 「IRLBA パッケージはメソッドの R 言語実装です。これを使用すると、非常に大規模なデータの部分 SVD と主成分分析を計算できます。このパッケージは、スパース行列や他の行列とうまく機能します。 Bigmemory パッケージで提供されるような行列クラス。" 詳細はこちらで確認できます

于 2012-11-28T21:38:44.633 に答える