分類にNaiveBayes/Simple classifier (Weka)を使い始めましたが、データのトレーニング中に理解しなければならない問題がいくつかあります。私が使用しているデータ セットは weather.nominal.arff です。
オプションからトレーニング テストを使用すると、分類器の結果は次のようになります。
Correctly Classified Instances 13 - 92.8571 %
Incorrectly Classified Instances 1 - 7.1429 %
a b classified as
9 0 a =yes
1 4 b = no
私の最初の質問は、誤って分類されたインスタンスから何を理解する必要がありますか? なぜこのような問題が発生したのでしょうか。どの属性コレクションが正しく分類されていませんか? これを理解する方法はありますか?
第 2 に、10 倍の交差検証を試みると、正しく分類されていない (少ない) インスタンスが得られるのはなぜですか?
結果は次のとおりです。
Correctly Classified Instances 8 57.1429 %
Incorrectly Classified Instances 6 42.8571 %
a b <-- classified as
7 2 | a = yes
4 1 | b = no