performance - Weka - J48 のパフォーマンスを向上させるにはどうすればよいですか?

翻译自：https://stackoverflow.com/questions/59776455 2020-01-16T19:21:36.347

162 次

Kickstarter プロジェクトの資金調達の成功の可能性を予測できるようにする必要があるときに、データマイニングプロジェクトに取り組んでいます。

Kaggle で見つけたキックスターターデータセットを使用し、ノイズの多いデータをすべて消去し、無関係な属性を削除し、別の有用な属性を追加しました。

現在、約 320K のインスタンスと 6 つの属性があります。

J48 アルゴリズムを実行した後、65.07% の正しく分類されたインスタンスと 68.7% の平均 ROC 領域が得られました。このパフォーマンスを改善する必要がありますが、方法がわかりません。

これは大学のプロジェクトなので、特定のルールがあります。アルゴリズムの Confidence Factor と NumMinObj のみを変更できます。すべての組み合わせを試すのに多くの時間を費やしました。

他に何ができますか？私のデータセットに何か問題があるのでしょうか?

performance - Weka - J4​​8 のパフォーマンスを向上させるにはどうすればよいですか?