Kickstarter プロジェクトの資金調達の成功の可能性を予測できるようにする必要があるときに、データ マイニング プロジェクトに取り組んでいます。
Kaggle で見つけたキックスターター データセットを使用し、ノイズの多いデータをすべて消去し、無関係な属性を削除し、別の有用な属性を追加しました。
現在、約 320K のインスタンスと 6 つの属性があります。
J48 アルゴリズムを実行した後、65.07% の正しく分類されたインスタンスと 68.7% の平均 ROC 領域が得られました。このパフォーマンスを改善する必要がありますが、方法がわかりません。
これは大学のプロジェクトなので、特定のルールがあります。アルゴリズムの Confidence Factor と NumMinObj のみを変更できます。すべての組み合わせを試すのに多くの時間を費やしました。