machine-learning - 不均衡データの特徴選択

翻译自：https://stackoverflow.com/questions/15084404 2013-02-26T08:21:12.827

269 次

私のデータセットでは、ターゲット変数は名目 (状態は 2 つしかありません) で、その他はすべて数値です。データセットは非常に不均衡です。不均衡なデータセットを処理するためのソリューションを探した結果、SMOTE (Synthetic Minority Over-sampling Technique) を見つけました。SMOTE アルゴリズムを適用すると、データセットのサイズが増加します (アルゴリズムの Weka 実装を使用しました)。

私の質問は、このような不均衡なデータセットでターゲット変数に最も影響を与える重要な機能/属性をどのように判断できるかということです. そのようなアルゴリズムに利用できる実装はありますか?

machine-learning - 不均衡データの特徴選択

0 に答える 0

Related

Reference