1

SMOTEを使用してデータセットをオーバーサンプリングしています(クラスの不均衡の影響を受けます)。私の属性の中には整数値を持つものもあれば、小数点以下2桁しかないものもありますが、SMOTEは多くの小数点を持つ新しいインスタンスを作成します。そこで、この問題を解決するために、NumericCleaner Filterを使用して、必要な小数点以下の桁数を設定することを考えました。これは機能しているようですが、値が欠落しているという問題があります。欠落している値はそれぞれ0.0値に置き換えられます。データセットの欠落している値を使用して、モデルを評価する必要があります。では、NumericCleaner(または値を丸めることができる他のフィルター)を使用して、欠落している値を保持するにはどうすればよいですか?

4

1 に答える 1

1

非常に興味深い質問です。さて、ここに解決策があります:

  1. SMOTE を使用して少数派グループをオーバーサンプリングします (これにより小数点が生成されますが、欠損値は欠損値のままです)
  2. 次に、weka filter-> unsupervised->attribute->NumericTransform を選択します
  3. 次に、このフィルターをクリックして、属性インスタンス (小数点機能がある場所) を設定し、methodName に「abs」ではなく「ceil」を入力します。

問題が解決することを願っています。

于 2012-04-20T14:34:23.033 に答える