8 つのパラメーター (4 つの連続的な 4 つのカテゴリ) を含むデータセットがあり、Scikit の RFEC クラスに従って機能を削除しようとしています。
これは私が使用している式です:
svc = SVC(kernel="linear")
rfecv = RFECV(estimator=svc, step=1, cv=StratifiedKFold(y, 2),
scoring='accuracy')
rfecv.fit(X, y)
カテゴリデータもあるので、dmatrics (Patsy) を使用してダミー変数に変更しました。
SVC とともにモデルを改善するために、特徴選択後にデータに対してさまざまな分類モデルを試したいと考えています。
データを変換した後に RFE を実行しましたが、間違っていると思います。
カテゴリ データを変換する前または後に RFECV を実行しますか?
どの文書にも明確な兆候が見つかりません。