CSV ファイルに非常に大きなトレーニング セット (~2Gb) があります。ファイルが大きすぎてメモリに直接読み込むことができない (read.csv()
コンピュータが停止する) ため、PCA を使用してデータ ファイルのサイズを縮小したいと考えています。問題は、(私が知る限り) PCA アルゴリズム (例: princomp()
) を実行するために、ファイルをメモリに読み込む必要があることです。
bigmemory
パッケージでファイルを として読み込もうとしましたbig.matrix
が、オブジェクトでprincomp
は機能せず、 のようなものに変換できるbig.matrix
ようには見えません。big.matrix
data.frame
princomp
不足している大きなデータ ファイルで実行する方法はありますか?
私は R の比較的初心者なので、これのいくつかはより経験豊富なユーザーには明らかかもしれません (前もってお詫びします)。
情報をありがとう。