3

状況: 1GB の CSV ファイル、100000 行、4000 個の独立数値変数、1 個の従属変数。16GB メモリを搭載した Windows Citrix サーバー上の R。

問題: 2 時間かかりました。すること:

read.table("full_data.csv", header=T, sep",")

glm プロセスがクラッシュし、プログラムが応答しなくなり、タスク マネージャーでシャットダウンする必要があります。

4

1 に答える 1

3

私はよくパッケージに頼ってsqldf大きな.csvをメモリにロードします。良いポインタはここにあります。

于 2012-07-09T20:18:55.980 に答える