機能 (列) とfloat 要素の行を含むX
マトリックスと、2 つのクラス 0 と 1 のベクトル ターゲットがあり、次元はです。クラスを区別するこのマトリックスの 10 個の最良の特徴を計算したいと思います。で定義されているカイ 2 乗を使用しようとしましたが、フロート要素です。1000
100
y
y
(100,1)
2
scikit-learn
X
使用できる機能を教えてください。
ありがとうございました。
機能 (列) とfloat 要素の行を含むX
マトリックスと、2 つのクラス 0 と 1 のベクトル ターゲットがあり、次元はです。クラスを区別するこのマトリックスの 10 個の最良の特徴を計算したいと思います。で定義されているカイ 2 乗を使用しようとしましたが、フロート要素です。1000
100
y
y
(100,1)
2
scikit-learn
X
使用できる機能を教えてください。
ありがとうございました。
Recursive Feature Elimination(RFE) は私にとって非常に効果的でした。この方法では、最初にすべてのフィーチャに重みを割り当て、重みが最小のフィーチャを削除します。このステップは、目的の機能数 (この場合は 10) に達するまで繰り返し適用されます。
http://scikit-learn.org/stable/modules/feature_selection.html#recursive-feature-elimination
私の知る限り、データが相関している場合、L1 ペナルティの選択は最良のアイデアではない可能性があります。私が間違っている場合は修正してください。