1

醜いレベル数(5000程度)のカテゴリ変数を持つデータセットがあります。コードを実行してダミー変数に変換すると、22 GB のメモリが必要であると表示され、クラッシュします。

dmy <- dummyVars(" ~ .", data = num_data)
new_data <- data.frame(predict(dmy, newdata = num_data))

この場合どうすればいいですか?クラウド ソリューションを利用しますか? 機能を最適化しますか?

4

1 に答える 1

0

はい、試してくださいsparse.model.matrix

または、メモリ制限を拡張します

 memory.limit(10*memory.limit())
于 2015-11-03T10:29:56.363 に答える