CSV ファイルに非常に大きなトレーニング セット (~2Gb) があります。ファイルが大きすぎてメモリに直接読み込むことができない (read.csv()コンピュータが停止する) ため、PCA を使用してデータ ファイルのサイズを縮小したいと考えています。問題は、(私が知る限り) PCA アルゴリズム (例: princomp()) を実行するために、ファイルをメモリに読み込む必要があることです。
bigmemoryパッケージでファイルを として読み込もうとしましたbig.matrixが、オブジェクトでprincompは機能せず、 のようなものに変換できるbig.matrixようには見えません。big.matrixdata.frame
princomp不足している大きなデータ ファイルで実行する方法はありますか?
私は R の比較的初心者なので、これのいくつかはより経験豊富なユーザーには明らかかもしれません (前もってお詫びします)。
情報をありがとう。