私は数値機能を扱っており、機能の重要性を見つけるために sklearn でディシジョン ツリー分類子を使用したいと考えています。
したがって、分割にエントロピー基準を選択すると、データを分割するための不純物の尺度として情報ゲインが使用されます。これは、Fayyad & Irani バイナリ離散化と同等だと思います。
最終的に、分類子は「機能の重要度」と呼ばれる属性を返します。
機能の重要性。高いほど、その機能は重要です。機能の重要性は、その機能によってもたらされる基準の (正規化された) 合計削減として計算されます。ジニ重要度 [R195] としても知られています。
私の質問は、情報ゲインを使用して最適な分割を見つけているにもかかわらず、「機能の重要度」は、エントロピー基準で見つかった分割で測定されたジニ重要度の値を返すのでしょうか?