いくつかの因子変数を持つ大きなデータフレーム(100k行x 50列)があります。小さなサブセット(100行など)でプロトタイピングを実行したいと思います。問題は私がタイプするときです:
train <- train[1:100,]
サイズは(を使用して)縮小しdim()
ますが、元のデータフレームからのすべての要素を保存しているように見えます(ここlsos()
にあるを使用してメモリサイズを測定しています)。
これを回避する方法はありますか?これまでのところ、私が見つけた唯一の方法は、因子変数を文字列に変換してからサブセット化し、次に因子に再度変換することです。これを行うにはもっと良い方法が必要だと思います。
助言がありますか?