いくつかの機械学習操作を実行するために、Python プログラムで scikit-learn を使用しています。問題は、私のデータセットに重大な不均衡の問題があることです。
scikit-learn または python の一般的な不均衡の解決策に精通している人はいますか? Java には SMOTE メカニズムがあります。pythonに類似したものはありますか?
いくつかの機械学習操作を実行するために、Python プログラムで scikit-learn を使用しています。問題は、私のデータセットに重大な不均衡の問題があることです。
scikit-learn または python の一般的な不均衡の解決策に精通している人はいますか? Java には SMOTE メカニズムがあります。pythonに類似したものはありますか?
ここに新しいのがあります
https://github.com/scikit-learn-contrib/imbalanced-learn
SMOTE を含む、次のカテゴリの多くのアルゴリズムが含まれています。
ここで、アンダーサンプリングと、複数の実装を含む複数のオーバーサンプリング手法を実装する別のライブラリと、次SMOTE
を使用する別のライブラリを見つけましたSVM
。