0

キャレット パッケージで gbm の重みを定義する方法を見つけたいと思います。「caret」パッケージの「train」関数にはパラメーター「weights」がありますが、説明には「この引数は、ケースの重みを許可するモデルにのみ影響します」と記載されています。私の理解によると、「gbm」は重みの定義をサポートしていますが、重みを定義する形式はわかりません。単純に c(1,10) です - 1 は多数派クラス、10 は少数派クラスですか?

2 番目の質問は、カッパ統計量に関するものです。Kappa は、クラスの不均衡なデータ セットのより優れたパフォーマンス メトリックであると読みましたが、その方法を理解できませんでした。クラスの不均衡なデータ セットの ROC と比較して、Kappa がより優れたパフォーマンス メトリックである理由について、いくつかのガイダンスをいただければ幸いです。

ありがとう。

4

2 に答える 2

1

私の知る限りでgbmは、サポート ケースの重みと重みはデータ フレームの長さのベクトルである必要があります。2 つのクラスしか使用していない場合は、ROC を使用する必要があると思います。ROC vs. Kappa に関するご質問にお答えできる資格があるかどうかはわかりませんが実世界のデータに関するいくつかの指標のパフォーマンスを調べた 2013 年の論文を次に示します。一般的に、カッパはスキューの影響を受ける可能性がありますが (ROC は比較的免疫があるようです)、ROC はパフォーマンスの低下を隠す傾向があるようです。

于 2015-08-07T14:38:00.560 に答える