0

私は小さなテキストの教師付き分類を行っていますが、データは非常にノイズが多いです。学習曲線をプロットしました。x 軸は # インスタンスです。y 軸は F メジャーの値です。曲線は下降しています。使用するインスタンスが多いほど、F 値スコアは低くなります。ノイズの多いデータの典型ですか? または、この動作には他の理由がありますか?

4

1 に答える 1

1

トレーニング セットまたはテスト セットを使用して F 値を計算しましたか?

トレーニング セットを使用して計算した場合、学習曲線が低下するのはごく普通のことです。

テスト セットを使用して計算した場合、多くの原因が考えられます。最も可能性が高いのは、トレーニング セットとテスト セットが iid でないことです。

于 2013-06-20T04:44:13.573 に答える