問題タブ [imbalanced-data]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
random-forest - 前処理を伴う GridSearchCV パイプラインでの SMOTEENN の使用
非常に不均衡なデータセットの分類問題に取り組んでいます。グリッド検索パイプラインで使用しようとしていますSMOTEENN
が、この ValueError が引き続き発生します:
imblearn からのパイプラインがインポートされている場合、SMOTEENN を GridSearchCV で使用できることがオンラインでわかりました。imblearn のパイプラインを使用していますが、それでもこのエラーが発生します。
SMOTEENN
この問題は、X 変数と y 変数を使用して取得しようとしたときに最初に発生しました。prepare_data()
データをX、yに分割する関数があります。SMOTEENN
その関数で使用して、バランスのとれたデータを返したいと思いました。ただし、私の機能の 1 つは文字列型であり、OneHotEncoder
. 何らかの理由で、SMOTEENN
文字列を処理していないようです。したがって、SMOTEENN
効果的になるようにパイプラインで使用する必要がありましたpost-preprocessing
。
以下にパイプライン コードを貼り付けます。どんな助けや説明も大歓迎です!ありがとうございました!