1D配列またはリストにsklearn分離フォレストを実装する方法はありますか? 私が遭遇したすべての例は、2次元以上のデータ用です。
私は現在、3 つの機能を備えたモデルを開発しており、抜粋したサンプル コードを以下に示します。
# dataframe of three columns
df_data = datafr[['col_A', 'col_B', 'col_C']]
w_train = page_data[:700]
w_test = page_data[700:-2]
from sklearn.ensemble import IsolationForest
# fit the model
clf = IsolationForest(max_samples='auto')
clf.fit(w_train)
#testing it using test set
y_pred_test = clf.predict(w_test)
私が主に頼ったリファレンス: IsolationForest の例 | scikit 学習
df_data は、3 つの列を持つデータ フレームです。私は実際に 1 ディメンションまたはリスト データで異常値を見つけようとしています。
もう 1 つの質問は、アイソレーション フォレスト モデルをどのように調整するかということです。方法の 1 つは、汚染値を増やして誤検知を減らすことです。ただし、n_estimators、max_samples、max_features、verbose などの他のパラメーターの使用方法。