2

同じ問題に関するさまざまな記事を見てきました。多くの解決策を試しましたが、何も機能していません。親切にアドバイス。

WEKA でエラーが発生します。

「分類子の評価の問題: テストとトレーニング セットに互換性がありません」。

私は使っている

私のアルゴリズムとしてのJ48

これは私のテストセットです:

Trainset:
https://www.dropbox.com/s/fm0n1vkwc4yj8yn/train.csv

Evalset:
https://www.dropbox.com/s/2j9jgxnoxr8xjdx/Eval.csv

(コードが長くてコピペできない)

WEKA (Traningset 用) で「バッチ フィルタリング」を試しましたが、まだ機能しません。

編集:私も変換しました.csv to .arff が、それでも同じ問題です。

EDIT2: 両方の CSV のヘッダーが一致することを確認しました。それでも同じ問題。助けてください!

ご意見をお聞かせください。

4

2 に答える 2

0

データセットをトレーニング セットとテスト セットに分割するにはどうすればよいですか?

RemovePercentageフィルター (パッケージ)を使用できますweka.filters.unsupervised.instance

エクスプローラーで次の操作を行うだけです。

トレーニング セット:

  • 完全なデータセットを読み込む
  • 前処理パネルでRemovePercentageフィルターを選択します
  • 分割の正しいパーセンテージを設定する
  • フィルターを適用する
  • 生成されたデータを新しいファイルとして保存します

テストセット:

  • データセット全体をロードします (または、元に戻すを使用してデータセットへの変更を元に戻します)。
  • まだ選択されていない場合は、RemovePercentage フィルターを選択します
  • invertSelection プロパティを true に設定します
  • フィルターを適用する
  • 生成されたデータを新しいファイルとして保存する
于 2015-06-04T13:42:41.360 に答える