4

コマンドラインからwekaを使用して分類を実行しようとしています。このリンクweka-Primer-commandlineには、テスト セットとトレーニング セットを作成するための次の例があります。

java weka.filters.supervised.instance.StratifiedRemoveFolds -i data/soybean.arff -o soybean-train.arff \
-c last -N 4 -F 1 -V

java weka.filters.supervised.instance.StratifiedRemoveFolds -i data/soybean.arff -o soybean-test.arff \
-c last -N 4 -F 1

このコードは、データの 3/4 をトレーニング用に、1/4 をテスト セット用に作成することになっていますか? 私には、データ全体の 1 つのフォールド (-V のため最後から) のみがトレーニングに割り当てられ、1 つのフォールドのみがテストに割り当てられるようです。私は正しいですか?トレーニングには 3/4 のデータ、テストには 1/4 のデータが必要です。

4

1 に答える 1

6

ドキュメントのコードは正しく、データの 3/4 をトレーニング セットに、1/4 をテスト セットに配置します。オプションの意味は次のとおりです。

  • -N: 4 つの折り畳みがあるはずです。つまり、データは重複しない 4 つの等しい部分に分割されます。
  • -F: これらのパーツ/折り目の最初のものを選択する必要があります
  • -V: 選択を反転

したがって、列車セットを作成する最初の行は次のように機能します。

  • 折り目を4つ作る
  • 最初のフォールドを選択し、残りの 3 つのフォールド (データの 3/4) を選択する結果の逆を取得します。

テストは、データの 1/4 である最初のフォールドのみを選択することによって簡単に作成されます。

于 2012-08-09T13:06:20.547 に答える