1

14 個の通常の属性を持つ一連のデータがあります。このトレーニング データからRapidminerで最適なデシソン ツリーを作成して、このツリーをスコアリング データに使用できるようにしようとしています。

しかし、デシジョン ツリーに使用するパラメーターがわかりません (例: 基準、最小ゲイン、信頼度など)。また、自分のモデルに適用できる/適用する必要がある他の演算子を (もしあれば) わかりませんか?

何が最適かについての一般的なヒントを誰か教えてもらえますか?

私が持っているデータは、誰かが新しい銀行口座を開設した場合、信用状態が良好かどうかを判断するためのものです. 信用度、口座の種類、履歴、職歴、性別、職業などの情報を持っています。

ありがとうございました。

4

1 に答える 1

1

一般に、サンプル数は機械学習プロセスの改善に役立ちます。このリンクを参照してくださいhttp://www.simafore.com/blog/bid/55751/how-to-use-decision-trees-for-credit-scoring-using-rapidminer-part -1

于 2012-11-02T09:18:52.770 に答える