リスト A と B の 2 つのリストがあり、A と B にはそれぞれ 100 個のデータ フレームが含まれ、各データ フレームのサイズは 25000 X 25000 です。次の方法でデータ フレーム全体の相関関係を見つけたいと思います。両方のリストにリストし、cor (A,B) を見つけて、データフレーム全体に相関する単一の値を取得します。同様に、両方のリストの 2 番目のリストを検討し、cor(A,B) を見つけて、100 個のデータフレームについてこれを続けます。
私は次のことを試しました:
A # list of 100 dataframes
$1 ### dataframe 1
$2
$3
....
$100 ### dataframe 100
B #list of 100 dataframes
$1 ### dataframe 1
$2
$3
....
$100 ### dataframe 100
C<- A[1] # extract only the first list from A
D<- B[1] # extract only the first list from B
C<-unlist(C) ### unlist C
D<-unlist(D) ## unlist D
次に計算
Correlation<- cor(C,D) ## to obtain a single correlation coefficient to see how these two vectors are correlated
しかし、私は言うエラーで終わります
R cannot allocate a vector of size 3.9 GB
リスト全体に実装できるより高速な方法でこれを行うより良い方法はありますか。大きな値を計算できるサーバーで作業していますが、それでもこのエラーが表示され、データフレームのサイズが原因でリストからの削除に時間がかかります。