6

Weka 3.7.9を使用してランダムフォレストモデルをファイルに保存しました。現在、他の(非常に大きな)セット(Amazon EC2の一部の大きなマシン)に対してそれを評価しようとしています。次のコマンドラインを使用しています。

> java -server -Xmx60000m -cp weka.jar weka.classifiers.Evaluation 
weka.classifiers.trees.RandomForest -T test.arff -l random-forest.model
-i -no-cv

ただし、私が持っている唯一の出力は次のようなものです。

=== Error on test data ===

Correctly Classified Instances     3252532               80.0686 %
Incorrectly Classified Instances    809651               19.9314 %
Kappa statistic                          0.2884
Mean absolute error                      0.2539
Root mean squared error                  0.3608
Coverage of cases (0.95 level)          98.7413 %
Total Number of Instances          4062183

私はこのようなものを探していますが:

=== Detailed Accuracy By Class ===

                 TP Rate  FP Rate  Precision  Recall   F-Measure  MCC      ROC Area  PRC Area  Class
                 0.804    0.295    0.731      0.804    0.766      0.512    0.826     0.803     buyer
                 0.705    0.196    0.783      0.705    0.742      0.512    0.826     0.798     non-buyer
Weighted Avg.    0.755    0.245    0.757      0.755    0.754      0.512    0.826     0.801     

=== Confusion Matrix ===

     a     b   <-- classified as
 61728 15004 |     a = buyer
 22662 54066 |     b = non-buyer

次のように、完全なトレーニングメソッドを再度実行した場合でも注意してください。

> java -Xmx60000m -cp weka.jar weka.classifiers.Evaluation 
weka.classifiers.trees.RandomForest -t train.arff -T test.arff 
-I 10 -K 0 -S 1 -num-slots 8 -d random-forest.model -i -no-cv

テストデータの混同行列はまだ表示されていません(トレーニングされたデータのみ)。

4

1 に答える 1

3

オプションを省略した場合に機能し-no-cvます。

于 2013-03-23T20:25:04.100 に答える