問題タブ [imblearn]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - ipythonノートブックにimblearn pythonパッケージをインポートする際の問題
、およびを使用して、 https://github.com/glemaitre/imbalanced-learnを Windows PowerShellにインストールしました。しかし、iPythonノートブックを使用していて、次を使用してパッケージをインポートしようとしたとき:pip install
conda
github
エラーが発生します:
Windows で Python を使用するのは初めてですが、パッケージをいくつかのフォルダーにインストールする必要がありますか?
pandas - パンダのマルチラベル不均衡データセットのアンダーサンプリング
imblearn
マルチラベル分類ではうまく機能しないため、独自のアンダーサンプリング関数に取り組んでいます(たとえば、1次元のみを受け入れますy
)。
X と y を反復処理して、多数派クラスの一部である 2 行または 3 行ごとに 1 行を削除します。目標は、多数派クラスの行数を減らす手っ取り早い方法です。
しかし、少量の行 (〜 30,000) でもカーネルがクラッシュします。
y
このようなものです, いつでもf2
またはf3
存在する,f1
存在する
それでは、0 が発生する回数を数えてから、f1
3 回ごとに 0 行を削除してみましょう。
scikit-learn - 交差検証パイプラインの分類レポート
SMOTE (imblearn ライブラリ) を使用した相互検証でパイプラインを使用して、不正顧客と非不正顧客の不均衡なデータセットをチェックしています。
混同行列と ROC 曲線を取得できますが、精度と合計の再現率が正確に必要です。どうすればよいですか?
編集
scikit-learn に classification_report があることは知っていますが、CV で行われた予測にどのように使用できますか?