トレーニングセットがあります。トレーニング セットに対して次のフィルターを実行しました。
- 四分位範囲 & RemoveWithValues (外れ値と極端な値を削除するため)。
- 欠損値を置換します。
- NumerictoNominal
クロス検証(10倍)で単純ベイズ分類器を使用しました。62% の精度を達成しました。モデルを保存しました。
そして、テストデータに「NumerictoNominal」フィルターを使用しました。テスト データには欠損値があり、Class 属性も空白です。属性の数と順序は、テスト データとトレーニング データで同じです。
また、Weka で Supplied test set オプションを使用して Naive bayes を実行すると、トレーニング データとテスト データに互換性がないというエラーが表示されます。