元のデータセットには 500 個のインスタンスがあり、10 個のクラスがあり、クラスの不均衡が存在します
クラスの不均衡を減らすために、オーバーサンプリング手法を使用しました。新しいデータセットには 1500 のインスタンスと 10 のクラスがあります。
元のデータセットに j48 分類器を適用し、63% の精度を得ました
新しいサンプリングされたデータセットには、j48 分類器を適用し、75% の精度を得ました。
私の質問は、私のデータが分類器に過剰に適合していることに疑いがあるということです。
データがオーバーフィットしているかどうかを確認する方法とオーバーフィットを減らす方法