1

約 2,000 の変数と約 10,000 の観測値を持つ巨大なデータがあります。最初は、1999 の独立変数を使用してそれぞれの回帰モデルを実行し、段階的なモデル選択を行いたいと考えていました。したがって、2,000 個のモデルが必要になります。

ただし、残念ながら、R はメモリ不足のためにエラーを表示しました。代わりに、相関値が低い独立変数をいくつか削除しようとしました。

各従属変数と高度に相関する変数を使用して、回帰モデルを実行したいと思います..

私は次のコードを実行しようとしましmeltたが、メモリの問題のために関数でさえ機能しません..なんてこった..

test<-data.frame(X1=rnorm(50,mean=50,sd=10),
             X2=rnorm(50,mean=5,sd=1.5),
             X3=rnorm(50,mean=200,sd=25))

test$X1[10]<-5

test$X2[10]<-5
test$X3[10]<-530

corr<-cor(test)
diag(corr)<-NA
corr[upper.tri(corr)]<-NA
melt(corr) 
#it doesn't work with my own data..because of lack of memory.

私を助けてください..そして、事前にどうもありがとう..!

4

1 に答える 1