デシジョンツリーのノイズに対抗するための良い戦略は何ですか?
私のトレーニングデータでは、
同じ属性を持つ 2 つのレコードがありますが、分類が異なります。
- 女性、高級、LV、はい
- 女性、高級、LV、なし
私の読書に基づいて、これら2つのレコードの複数分類を返すように言っています。
しかし、予測の出力は「はい」または「いいえ」のいずれかである必要があるため、予測を行いたいときに問題が発生します。
したがって、この場合に予測に使用できる戦略は何かを見つけようとしています。
ありがとうございました。