Scikit-learn Extremely Randomized Trees アルゴリズムを使用して、相対的な特徴の重要性に関する情報を取得しています。「冗長な特徴」がどのようにランク付けされるかについて質問があります。
同一 (冗長) で分類にとって重要な 2 つの特徴がある場合、極端にランダム化されたツリーは特徴の冗長性を検出できません。つまり、両方の機能が上位にランクされます。2 つの機能が実際に重複していることを検出する他の方法はありますか?
Scikit-learn Extremely Randomized Trees アルゴリズムを使用して、相対的な特徴の重要性に関する情報を取得しています。「冗長な特徴」がどのようにランク付けされるかについて質問があります。
同一 (冗長) で分類にとって重要な 2 つの特徴がある場合、極端にランダム化されたツリーは特徴の冗長性を検出できません。つまり、両方の機能が上位にランクされます。2 つの機能が実際に重複していることを検出する他の方法はありますか?