python - ランダムフォレスト: テストセットのバランスをとっていますか?

翻译自：https://stackoverflow.com/questions/54910960 2019-02-27T17:11:18.000

704 次

不均衡なデータセット (~1:4) でランダムフォレスト分類子を実行しようとしています。

次のように imblearn のメソッドを使用しています。

from imblearn.ensemble import BalancedRandomForestClassifier

rf=BalancedRandomForestClassifier(n_estimators=1000,random_state=42,class_weight='balanced',sampling_strategy='not minority')
rf.fit(train_features,train_labels) 
predictions=rf.predict(test_features)

RepeatedStratifiedKFoldトレーニングセットとテストセットの分割は、scikit Learnを使用したクロス検証アプローチ内で実行されます。

ただし、適切な精度スコア (感度、特異性など) を得るために、テストセットのバランスもとっておく必要があるのではないかと思います。これで私を助けてくれることを願っています。

どうもありがとう！

python - ランダム フォレスト: テスト セットのバランスをとっていますか?

1 に答える 1

Related

Reference

python - ランダムフォレスト: テストセットのバランスをとっていますか?