0

m個のクラスでn分割交差検定を実行すると、各分割で、トレインセットとテストセットのバランスが取れていますか?バランスが取れているということは、トレインセットとテストセットの各クラスから(ほぼ)同じサンプルのセットがあるかどうかを尋ねることを意味します。

4

1 に答える 1

5

この部分を正しく理解している場合:

トレインセットとテストセットの各クラスから(ほぼ)同じサンプルのセットがあるかどうかを尋ねることを意味します。

...層化交差検定を参照していると思います。各フォールドのクラス比率は、データセット全体のクラス比率と同じです。

はい、Wekaでは確かに可能ですが、ドキュメントを参照することをお勧めします。これらは助けになりますか?

http://weka.wikispaces.com/Primer

http://weka.wikispaces.com/Generating+cross-validation+folds+(Java+approach)

http://weka.sourceforge.net/doc/weka/filters/supervised/instance/StratifiedRemoveFolds.html

于 2013-01-31T17:41:21.277 に答える