トレーニングデータセットとテストデータセットの各行には、画像内のピクセルの強度値があり、最後の列には、画像内でどの桁が表されているかを示すラベルが付いています。ラベルはトレーニングセットで0から9までの任意の数にすることができ、常に?テストセットで。
トレーニングデータセットをWekaExplorerにロードし、データをNumericalToNominalフィルターに渡し、RemovePercentageフィルターを使用してデータを70〜30の比率で分割し、30%のファイルを相互検証セットとして使用しました。分類子を作成してモデルを保存しました。
次に、?を含むテストデータをロードしました。各行のラベルに対して、NumericToNominalフィルターを適用し、arffファイルとして保存しました。
これで、テストデータをロードしてモデルを使用しようとすると、「トレーニングとテストセットに互換性がありません」というエラーメッセージが常に表示されます。両方のデータセットは同じ処理を受けています。何がうまくいかなかったのでしょうか?