LMT (ロジスティック モデル ツリー) DT (デシジョン ツリー) の WEKA 実装における個々の変数の重要性を判断しようとしています。
分類タスクにおける個々の変数の寄与を知りたいので、個々の変数の重要性を判断する必要があります。これは、私の結果をより詳細に分析するためのものです。
「属性の選択」タブと対応するアルゴリズム (主成分、情報ゲイン、ランカーなど) については既に調べました。ただし、これらのアルゴリズムは、変数のどの組み合わせまたはランクが最高の (または、最終目標である分類器に応じて、最も効果的または最速) に貢献するかに関する情報を提供します。
ただし、最も重要な変数をランク付けしたり選択したりすることには興味がありません。各変数が DT の最終的な分類スコアにどの程度 (たとえば、パーセンテージ形式で) 寄与したかを判断したいと考えています。
スコアがどのように変化するかを判断するために、各変数を 1 つずつ削除することを検討しました。しかし、最終的なスコアはいくつかの潜在的な相関関係に依存する可能性があるため、これを手動で実行できるかどうかはわかりません。そのため、すべての変数を一緒に使用してこの決定を行いたいのです (1 つの寄与がゼロであっても)。
そこで問題は、分類子で使用される各個別変数の寄与を測定する方法はあるのでしょうか (その寄与がゼロであっても)?
ご協力いただきありがとうございます。