1

私のデータセットでは、ターゲット変数は名目 (状態は 2 つしかありません) で、その他はすべて数値です。データセットは非常に不均衡です。不均衡なデータ セットを処理するためのソリューションを探した結果、SMOTE (Synthetic Minority Over-sampling Technique) を見つけました。SMOTE アルゴリズムを適用すると、データ セットのサイズが増加します (アルゴリズムの Weka 実装を使用しました)。

私の質問は、このような不均衡なデータセットでターゲット変数に最も影響を与える重要な機能/属性をどのように判断できるかということです. そのようなアルゴリズムに利用できる実装はありますか?

4

0 に答える 0