1

scikit-learn には、極端にランダム化されたツリーを使用して機能をランク付け (分類) するメカニズムがあります。

forest = ExtraTreesClassifier(n_estimators=250,
                          compute_importances=True,
                          random_state=0)

この方法が「一変量」または「多変量」の機能ランキングを行っているかどうかについて質問があります。単変量のケースでは、個々の機能が互いに比較されます。ここでいくつかの説明をいただければ幸いです。いじる必要がある他のパラメーターはありますか? このランキング方法に関する経験や落とし穴も大歓迎です。このランキングの出力は、特徴番号 (5、20、7) を識別します。特徴番号が本当に特徴マトリックスの行に対応するかどうかを確認したいと思います。つまり、特徴番号 5 は、特徴マトリックスの 6 行目に対応します。 (0 から始まります)。

4

1 に答える 1