0

Weka には、「ReplaceMissingValues」というフィルターがあり、各属性の平均を使用して、データセット内のすべての欠損値を置き換えることができます。特定のクラスに属する値の平均を使用して、特定の属性の欠損値を置き換えたいと思います。たとえば、バイナリ データセットでは、ポジティブ クラスに属するレコードのみで計算された平均値を使用して、ポジティブ クラスに属するレコードの属性の欠損値を置き換える方が正しいと思います。では、それを実現するにはどうすればよいのでしょうか。特定のクラスに属するレコードの値のみを置き換えるにはどうすればよいでしょうか?

4

1 に答える 1

1

特定のクラス A のトレーニング インスタンスから計算された平均値を取得して、クラス A の欠損値を置き換えたい場合は、データセットを「バイアス」しています。偏り (最終的にはトレーニング済みのモデルに過剰適合することになります) を回避するには、デフォルトの「欠損値の置換」関数を使用するのが賢明です。つまり、特定のクラスだけでなく、すべてのトレーニング インスタンスの平均値と最頻値を考慮することです。

于 2012-04-23T00:08:14.923 に答える