5

weightsR gbm関数の引数は何ですか? コストに敏感な確率的勾配ブースティングを実装していますか?

4

1 に答える 1

4

すでにこれを読んでいるかもしれませんが、ドキュメントには、weightsパラメーターが次のように定義されていると書かれています。

フィッティング プロセスで使用される重みのオプションのベクトル。正でなければなりませんが、正規化する必要はありません。gbm への最初の呼び出しで keep.data=FALSE の場合、重みを gbm.more に再供給するのはユーザーの責任です。

したがって、私の解釈では、統計モデルと同様に、それらは標準的な観測の重みです。

コスト重視ですか?良い質問。私が最初に気付いたのは、パッケージの主な引用の 1 つが次のとおりであることです。

B.クリーグラー(2007)。量的回帰フレームワーク内のコストに敏感な確率的勾配ブースティング

だから私はそれがコスト重視を暗示していると考えましたが、ビネットでその用語が明示的に使用されていないので、それが明らかではなかった場合.

ただし、もう少し深く掘り下げて、さらにいくつかのリソースを見つけました。パッケージについて説明するこの記事の最後に、重みを説明する方程式を見つけることができます。

また、この質問は 2009 年にメーリング リストで尋ねられたものであり、回答はありませんでしたが、コストに敏感な勾配ブースティングのための およびその他の R パッケージの使用について議論している学術記事を最終的に見つけました。gbm

結論は、gbmの分位損失関数は微分可能であり、過大/過小評価が異なるエラー コストを持つコストに敏感なアプリケーションで使用できるということですが、他の定量的損失関数 (分位は別として) が必要/適切である場合があります。コストに敏感な勾配ブースティング。

そのペーパーは中心ですgbmが、他のパッケージについても説明しています。コストに敏感な勾配ブースティングに焦点を当てている場合は、ペーパーで言及されている他のパッケージも確認することをお勧めします。

于 2015-04-16T12:19:31.177 に答える