貸し出しクラブのデータを調べて、最適な X ローンを選択する分類子を構築しています。ランダム フォレストをトレーニングし、通常の ROC 曲線、混同行列などを作成しました。
混同行列は、分類器の予測 (森の中の木の多数派予測) を引数として取ります。ただし、10% の最良のローン、20% の最良のローンなどを選択した場合に何が起こるかを知るために、異なるしきい値で複数の混同行列を出力したいと考えています。
他の質問を読んで、しきい値を変更することはしばしば悪い考えであることを知っていますが、これらの状況で混同行列を確認する他の方法はありますか? (質問A)
しきい値の変更を進める場合、 proba を予測して手動でしきい値を設定し、それを Confusion Matrix に渡すのが最善の方法であると想定する必要がありますか? (質問B)