約 2,000 の変数と約 10,000 の観測値を持つ巨大なデータがあります。最初は、1999 の独立変数を使用してそれぞれの回帰モデルを実行し、段階的なモデル選択を行いたいと考えていました。したがって、2,000 個のモデルが必要になります。
ただし、残念ながら、R はメモリ不足のためにエラーを表示しました。代わりに、相関値が低い独立変数をいくつか削除しようとしました。
各従属変数と高度に相関する変数を使用して、回帰モデルを実行したいと思います..
私は次のコードを実行しようとしましmelt
たが、メモリの問題のために関数でさえ機能しません..なんてこった..
test<-data.frame(X1=rnorm(50,mean=50,sd=10),
X2=rnorm(50,mean=5,sd=1.5),
X3=rnorm(50,mean=200,sd=25))
test$X1[10]<-5
test$X2[10]<-5
test$X3[10]<-530
corr<-cor(test)
diag(corr)<-NA
corr[upper.tri(corr)]<-NA
melt(corr)
#it doesn't work with my own data..because of lack of memory.
私を助けてください..そして、事前にどうもありがとう..!