1

トレーニングセットがあります。トレーニング セットに対して次のフィルターを実行しました。

  1. 四分位範囲 & RemoveWithValues (外れ値と極端な値を削除するため)。
  2. 欠損値を置換します。
  3. NumerictoNominal

クロス検証(10倍)で単純ベイズ分類器を使用しました。62% の精度を達成しました。モデルを保存しました。

そして、テストデータに「NumerictoNominal」フィルターを使用しました。テスト データには欠損値があり、Class 属性も空白です。属性の数と順序は、テスト データとトレーニング データで同じです。

また、Weka で Supplied test set オプションを使用して Naive bayes を実行すると、トレーニング データとテスト データに互換性がないというエラーが表示されます。

4

1 に答える 1

3

この質問に対する私の回答を参照してください。テスト ファイルとトレーニング ファイルで同じヘッダー情報が必要です。

于 2013-04-02T06:24:25.487 に答える