machine-learning - 列車とテストセットは、weka で互換性のないエラーですか?

Question

新しいデータセットでモデルをテストしようとしています。モデルを構築するために行ったのと同じ前処理手順を実行しました。2 つのファイルを比較しましたが、問題はありません。すべての属性 (トレーニングとテストデータセット) を同じ順序で、同じ属性名とデータ型にしています。しかし、それでも問題を解決できません。ファイル train と test はどちらも似ているように見えますが、weka エクスプローラーで、Train と test set に互換性がないというエラーが表示されます。このエラーを解決するにはどうすればよいですか? test.arff ファイル形式を train.arff にする方法はありますか? 誰か助けてください。

これがファイル比較のスクリーンショットです

score 8 · Accepted Answer

問題文の後に私が残したコメントと同じです：

3 つの属性はすべて名義属性であり、その後に「{}」で引用されたすべての可能な値が続きます。私の推測の 1 つは、可能な値が同じではないということです。たとえば、RESOURCE 属性の場合、テストファイルには 199 はありませんが、トレーニングファイルにはあります。

score 3 · Accepted Answer

一日同じ問題に苦しんだ後。トレーニング済みのモデルを提供されたテストセットで動作させる 2 つの方法を考え出しました。

方法 1. ナレッジフローを使用する。たとえば、次のようなものです: CSVLoader(トレインセット用) -> classAssigner -> TrainingSetMaker -> (選択した分類子) -> ClassfierPerformanceEvaluator - TextViewer。CSVLoader (テストセット用) -> classAssigner -> TestgSetMaker -> (上記と同じ分類子インスタンス) -> PredictionAppender -> CSVSaver。次に、トレーニングセットの CSVLoader または arffLoder からデータを読み込みます。モデルがトレーニングされます。その後、テストセットのローダーからデータをロードします。提供されたテストセットでモデル (分類子など) を評価し、(ClassifierPerformanceEvaluator に接続された) textviewer から結果を確認し、PredictionAppender に接続された CSVSaver または arffSaver から保存された結果を取得できます。追加の列、「として分類された」出力ファイルに追加されます。私の場合、「？」を使用しました。クラスラベルが利用できない場合は、提供されたテストセットのクラス列に。

方法 2. トレーニングセットとテストセットを 1 つのファイルに結合します。次に、まったく同じフィルターをトレーニングセットとテストセットの両方に適用できます。次に、インスタンスフィルターを適用して、トレーニングセットとテストセットを分離できます。「？」を使っているのでテストセットのクラスラベルとして。インスタンスフィルタインデックスには表示されません。したがって、インスタンスフィルターを適用するときに削除する属性値に表示されるインデックスを選択するだけです。テストデータのみが残ります。それを保存し、分類子ページのサプライテストセットにロードします。今回は機能します。互換性のない列車とテストセットの問題を引き起こすのはクラス属性だと思います。名義クラス属性を必要とする分類子の数だけ。その値は、次に従ってクラス属性の使用可能な値へのインデックスに変換されます。 http://weka.wikispaces.com/Why+do+I+get+the+error+message+%27training+and+test+set+are+not+compatible%27%3F

score 0 · Accepted Answer

同様のものと同じものの間に違いがあることを確認してください。train.arrf と test.arrf には同じヘッダーが必要です。そうでない場合は、train.arrf のヘッダーをコピーして、新しいヘッダーとして test.arrf に貼り付ける必要があります。

machine-learning - 列車とテスト セットは、weka で互換性のないエラーですか?

6 に答える 6

Related

Reference

machine-learning - 列車とテストセットは、weka で互換性のないエラーですか?