randomForest
観測の重みでR パッケージを使用するにはどうすればよいですか? このパッケージにはそのようなオプションがないことを知っています。2 つの質問があります。
randomForest
パッケージを使用してこの問題の解決策はありますか? 現時点では、重みを確率としてデータからサンプルを抽出しているため、少なくともシミュレートできます。m = dim(data)[1] sample(data, m, replace=TRUE, prob=weights)
他の(より良い)解決策はありますか?
randomForest
パッケージの代替品はありますか。パッケージ (cforest)を見つけましたparty
が、メモリ管理の点でひどいです (または、パッケージを使用する方法では使用できませんrandomForest
)。約 20 万の観測と 30 ~ 40 の変数があります。
編集:
詳細を明確にしておらず申し訳ありません。randomForest
回帰問題(分類ではない)にパッケージを使用しています。これは時系列であり、すべての観測には重みがあります。後で、この重みを使用して、テスト観測全体でモデルのパフォーマンスを決定します。y 変数は連続です。