14 個の通常の属性を持つ一連のデータがあります。このトレーニング データからRapidminerで最適なデシソン ツリーを作成して、このツリーをスコアリング データに使用できるようにしようとしています。
しかし、デシジョン ツリーに使用するパラメーターがわかりません (例: 基準、最小ゲイン、信頼度など)。また、自分のモデルに適用できる/適用する必要がある他の演算子を (もしあれば) わかりませんか?
何が最適かについての一般的なヒントを誰か教えてもらえますか?
私が持っているデータは、誰かが新しい銀行口座を開設した場合、信用状態が良好かどうかを判断するためのものです. 信用度、口座の種類、履歴、職歴、性別、職業などの情報を持っています。
ありがとうございました。