m個のクラスでn分割交差検定を実行すると、各分割で、トレインセットとテストセットのバランスが取れていますか?バランスが取れているということは、トレインセットとテストセットの各クラスから(ほぼ)同じサンプルのセットがあるかどうかを尋ねることを意味します。
2047 次
1 に答える
5
この部分を正しく理解している場合:
トレインセットとテストセットの各クラスから(ほぼ)同じサンプルのセットがあるかどうかを尋ねることを意味します。
...層化交差検定を参照していると思います。各フォールドのクラス比率は、データセット全体のクラス比率と同じです。
はい、Wekaでは確かに可能ですが、ドキュメントを参照することをお勧めします。これらは助けになりますか?
http://weka.wikispaces.com/Primer
http://weka.wikispaces.com/Generating+cross-validation+folds+(Java+approach)
http://weka.sourceforge.net/doc/weka/filters/supervised/instance/StratifiedRemoveFolds.html
于 2013-01-31T17:41:21.277 に答える