machine-learning - ノイズの多いデータの学習曲線

Question

私は小さなテキストの教師付き分類を行っていますが、データは非常にノイズが多いです。学習曲線をプロットしました。x 軸は # インスタンスです。y 軸は F メジャーの値です。曲線は下降しています。使用するインスタンスが多いほど、F 値スコアは低くなります。ノイズの多いデータの典型ですか? または、この動作には他の理由がありますか?

score 1 · Accepted Answer

トレーニングセットまたはテストセットを使用して F 値を計算しましたか?

トレーニングセットを使用して計算した場合、学習曲線が低下するのはごく普通のことです。

テストセットを使用して計算した場合、多くの原因が考えられます。最も可能性が高いのは、トレーニングセットとテストセットが iid でないことです。

machine-learning - ノイズの多いデータの学習曲線

1 に答える 1

Related

Reference