Pythonでsklearnのロジスティック回帰を使用して分類問題を解決しています。
私の問題は一般的/一般的なものです。2 つのクラス/結果 (正/負または 1/0) を持つデータセットがありますが、セットは非常に不均衡です。~5% の陽性と ~95% の陰性があります。
このような不均衡な問題に対処する方法がいくつかあることは知っていますが、sklearn パッケージを使用して適切に実装する方法についての適切な説明は見つかりませんでした。
これまでに行ったことは、肯定的な結果を持つエントリと、ランダムに選択された同数の否定的なエントリを選択することによって、バランスの取れたトレーニング セットを構築することです。その後、モデルをこのセットにトレーニングできますが、モデルを変更して元の不均衡な母集団/セットに取り組む方法に行き詰まっています。
これを行うための具体的な手順は何ですか? sklearn のドキュメントと例を調べましたが、適切な説明が見つかりませんでした。