これは、この URL ( Apply PCA on very large sparse matrix )で尋ねられたのと同様の質問のように思えるかもしれません。
しかし、私はまだ助けが必要な答えを得ることができません。約 700 のサンプル (列) と 4,00,000 を超える遺伝子座 (行) の非常に大きなデータセットに対して PCA を実行しようとしています。で「サンプル」をプロットしbiplot
たいので、主成分を計算するために 4,00,000 の軌跡すべてを考慮したいと考えています。
を使用してみprincomp()
ましたが、次のエラーが表示されます。
Error in princomp.default(transposed.data, cor = TRUE) :
'`princomp`' can only be used with more units than variables
フォーラムで確認したところ、変数よりも単位が少ない場合は、 よりも使用した方がよいことがprcomp()
わかっprincomp()
たので、それも試しましたが、再び次のエラーが表示されます。
Error in cor(transposed.data) : allocMatrix: too many elements specified
だから、私の非常に大きなデータに最適な他の良いオプションを提案してくれる人がいるかどうか知りたい. 私は統計の初心者ですが、PCA の仕組みについては読みました。これを実行するための使いやすい R パッケージまたはツールが他にあるかどうか知りたいですか?