問題タブ [imbalanced-data]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
scikit-learn - ロジスティック回帰 - class_weight バランス対 dict 引数
不均衡なトレーニング データセットのバイナリ分類 (たとえば、85% pos クラスと 15% neg クラス) に sklearn LogisticRegression 関数を使用する場合、class_weight 引数を「balanced」に設定するのと {0:0.15, 1: 0.85}? ドキュメントに基づいて、「バランスの取れた」引数を使用すると、辞書を提供するのと同じことが行われるように思えます。
class_weight
「バランス」モードでは、y の値を使用して、入力データのクラス頻度に反比例する重みを n_samples / (n_classes * np.bincount(y)) として自動的に調整します。
python - オブジェクトと数値を含む列を持つデータ フレームに SMOTENC を適用するにはどうすればよいですか?
categorical_features パラメーターに含める列の組み合わせを試してみましたが、どれも機能していません。私のデータ名声にも null 値はありません。私が Smotenc を使用している理由は、私のターゲット ベクトルが非常に歪んでいるためです: 99.7% はい、0.3% いいえ。助けてください。