-1

トレーニング エラーまたはエラー (D) を見つけ、エラーまたはエラーをテストする必要があります。

仮説的に、エラーを見つけるには次の式を使用します: 誤分類されたインスタンス/合計インスタンス、次にエラー (D) を見つけるためにエラー (s)+-confidenceInterval (sqrt(error(s(1-error(s)/n))) を使用します。 ))
ここで n= 合計インスタンス

誤分類されたインスタンスを見つけるにはどうすればよいですか? weka の評価クラスの評価モデルを使用して見つけることができる誤って分類されたインスタンスと同じですか? 私に教えてください

コード:

import weka.classifiers.evaluation.Evaluation;
import weka.classifiers.trees.J48;
import weka.classifiers.trees.j48.ClassifierTree;
import weka.core.Instances;
import weka.core.converters.ConverterUtils.DataSource;
@SuppressWarnings("unused")
public class J48Tree {
public static void main(String[] args) throws Exception {       
    //load dataset
     DataSource trainsource = new DataSource(".//training data.arff");
     DataSource testsource = new DataSource(".//test data.arff");
     Instances dataset=trainsource.getDataSet();
     Instances datatestset=testsource.getDataSet();     
     //set class index to the last attribute
     dataset.setClassIndex(dataset.numAttributes()-1);
     datatestset.setClassIndex(dataset.numAttributes()-1);          
     //create classifier
     J48 tree = new J48();
     //using an unpruned J48 
     tree.setUnpruned(true);
     //build the classifier
     tree.buildClassifier(dataset);     
     // evaluate classifier and print some statistics
     Evaluation eval = new Evaluation(dataset);
     eval.evaluateModel(tree, datatestset);
     System.out.println(eval.toSummaryString("\nResults\n======\n", true));         
 }    }

出力:

結果

Correctly Classified Instances         540               22.2772 %
Incorrectly Classified Instances      1884               77.7228 %
Kappa statistic                          0.0644
K&B Relative Info Score              78375.7967 %
K&B Information Score                 1912.8906 bits      0.7891     bits/instance
Class complexity | order 0            7268.6047 bits      2.9986 bits/instance
Class complexity | scheme           725668.4216 bits    299.3682 bits/instance 
Complexity improvement     (Sf)    -718399.8169 bits   -296.3696 bits/instance
Mean absolute error                      0.2186
Root mean squared error                  0.3897
Relative absolute error                 91.6895 %
Root relative squared error            109.0212 %
Total Number of Instances             2424     
4

1 に答える 1

0

「誤って分類された」と「誤って分類された」が同じであることに疑問がある場合は、ソースを使用してください。

Weka のソース コード (幸いなことに、これはオープン ソースです) を見ることが、それが正確に何をしているのかを知る唯一の方法です。「そうです」と言ったとしても、あるバージョンでは正しく、別のバージョンでは間違っている可能性があります。したがって、バージョンのソースを信頼できるリソースとして使用してください。

于 2016-11-02T06:28:52.537 に答える