私は小さなテキストの教師付き分類を行っていますが、データは非常にノイズが多いです。学習曲線をプロットしました。x 軸は # インスタンスです。y 軸は F メジャーの値です。曲線は下降しています。使用するインスタンスが多いほど、F 値スコアは低くなります。ノイズの多いデータの典型ですか? または、この動作には他の理由がありますか?
私は小さなテキストの教師付き分類を行っていますが、データは非常にノイズが多いです。学習曲線をプロットしました。x 軸は # インスタンスです。y 軸は F メジャーの値です。曲線は下降しています。使用するインスタンスが多いほど、F 値スコアは低くなります。ノイズの多いデータの典型ですか? または、この動作には他の理由がありますか?