教師なし離散化フィルターを適用して、WEKA モデルの精度を向上させようとしています。ビンの数と、等頻度ビニングを使用するかどうかを決定する必要があります。通常、トレーニング セットを使用してこれを最適化します。
ただし、クロス検証を使用するときにビン サイズと等頻度ビニングを使用する必要があるかどうかを判断するにはどうすればよいですか? 私の最初のアイデアは、複数の相互検証テストで分類器の精度結果を使用して、最適なビン サイズを見つけることでした。しかし、クロスバリデーションを使用しているにもかかわらず、この同じセットを使用してモデルの精度をテストするのは間違っていますか? では、ビンのサイズを決定する正しい方法は何でしょうか?
また、教師付き離散化フィルターを使用してビンのサイズを決定しようとしましたが、これは単一のビンのみになります。これは、データがランダムすぎるため、複数のビンにクラスター化できないということですか?