問題タブ [imbalanced-data]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
285 参照

random-forest - 前処理を伴う GridSearchCV パイプラインでの SMOTEENN の使用

非常に不均衡なデータセットの分類問題に取り組んでいます。グリッド検索パイプラインで使用しようとしていますSMOTEENNが、この ValueError が引き続き発生します:

imblearn からのパイプラインがインポートされている場合、SMOTEENN を GridSearchCV で使用できることがオンラインでわかりました。imblearn のパイプラインを使用していますが、それでもこのエラーが発生します。

SMOTEENNこの問題は、X 変数と y 変数を使用して取得しようとしたときに最初に発生しました。prepare_data()データをX、yに分割する関数があります。SMOTEENNその関数で使用して、バランスのとれたデータを返したいと思いました。ただし、私の機能の 1 つは文字列型であり、OneHotEncoder. 何らかの理由で、SMOTEENN文字列を処理していないようです。したがって、SMOTEENN効果的になるようにパイプラインで使用する必要がありましたpost-preprocessing

以下にパイプライン コードを貼り付けます。どんな助けや説明も大歓迎です!ありがとうございました!