問題タブ [j48]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 1 つの決定木 (J48) 分類から Python でのアンサンブルへの変換
論文をもとにアルゴリズムの分類を実装したいと思います。私は単一のJ48
(C4.5)決定木を持っています(コードは言及されていません)。I_max
データセットに対して数回 ( ) 回実行し、すべてのアンサンブルの C* = クラス メンバーシップ確率を計算したいと思います。こちらと論文の8ページに記載されているとおりです。
r - 予測のための J48 アルゴリズムを使用して文字列に基づいて決定木をプロットする
文字列値の属性に基づいて J48 ディシジョン ツリーをプロットし、ターゲット変数 (カテゴリ) を予測しようとしています。数値に基づいてディシジョン ツリーをプロットする多くの例を見てきましたが、文字列に基づいて遭遇したことはありません。
これがサンプル データ セットです。J48 ディシジョン ツリーは問題なく動作します。
ヘッダーの名前を sepal_length、sepal_width、および sepal_color に変更し、値を「白」、「黒」、色の組み合わせを setosa、versicolor、および virginca に変更した場合、決定木をプロットしてターゲット種の値を予測するにはどうすればよいですか。
以下のようなデータセットがあるとします。
performance - Weka - J48 のパフォーマンスを向上させるにはどうすればよいですか?
Kickstarter プロジェクトの資金調達の成功の可能性を予測できるようにする必要があるときに、データ マイニング プロジェクトに取り組んでいます。
Kaggle で見つけたキックスターター データセットを使用し、ノイズの多いデータをすべて消去し、無関係な属性を削除し、別の有用な属性を追加しました。
現在、約 320K のインスタンスと 6 つの属性があります。
J48 アルゴリズムを実行した後、65.07% の正しく分類されたインスタンスと 68.7% の平均 ROC 領域が得られました。このパフォーマンスを改善する必要がありますが、方法がわかりません。
これは大学のプロジェクトなので、特定のルールがあります。アルゴリズムの Confidence Factor と NumMinObj のみを変更できます。すべての組み合わせを試すのに多くの時間を費やしました。
weka - 葉の数と木のサイズは Weka で何を意味しますか?
Weka で葉の数と木のサイズが何を意味するかをわかりやすい英語で誰か説明してもらえますか? 私は決定木を作成しました。これは以下のとおりですが、これらの値が何を意味するかについて説明が必要です。ありがとうございました。
葉の数: 49; ツリーのサイズ: 87。