17

randomForest観測の重みでR パッケージを使用するにはどうすればよいですか? このパッケージにはそのようなオプションがないことを知っています。2 つの質問があります。

  1. randomForestパッケージを使用してこの問題の解決策はありますか? 現時点では、重みを確率としてデータからサンプルを抽出しているため、少なくともシミュレートできます。

    m = dim(data)[1]
    sample(data, m, replace=TRUE, prob=weights)
    

    他の(より良い)解決策はありますか?

  2. randomForestパッケージの代替品はありますか。パッケージ (cforest)を見つけましたpartyが、メモリ管理の点でひどいです (または、パッケージを使用する方法では使用できませんrandomForest)。約 20 万の観測と 30 ~ 40 の変数があります。

編集:

詳細を明確にしておらず申し訳ありません。randomForest回帰問題(分類ではない)にパッケージを使用しています。これは時系列であり、すべての観測には重みがあります。後で、この重みを使用して、テスト観測全体でモデルのパフォーマンスを決定します。y 変数は連続です。

4

2 に答える 2

3

私はランダム フォレストであなたと同じ選択肢を探していました。そして、Rのパッケージ「レンジャー」が関数「レンジャー」に組み込まれていることがわかりました(パラメーター「case.weights」を介して)。

パッケージは2016年6月発売なのでとても若いです。

一番、

于 2016-09-20T21:11:03.870 に答える
2

randomForestには、差分サンプリング確率や差分コストを考慮できる「classwt」パラメーターがあります。確かに、回帰では無視されます。おそらく、重み付けを使用する必要がある理由と、使用している y 変数の種類を説明する必要があります。

于 2012-03-25T19:58:09.737 に答える