非常に大きなデータセット (約 1 億 4000 万行) で gbm パッケージを使用して実験しようとしていますが、R のメモリ要件に関する問題に遭遇しました。
パッケージ 'gbm' と 'bigmemory' を組み合わせてみましたが成功しませんでした。次に考えたのは、C++ ソース コードを変更して、データセットを保存したローカル データベースからデータを取得することでした。
そのため、gbm の C++ コード内の割り当てを変更するためのより適切な、またはよく知られている方法があるかどうか疑問に思っていました。誰かが似たようなことを試しましたか?