2

libsvm画像分類に使用しています。分類に多くの特徴を使用すると、予測精度が低下するのはなぜですか? 増やせばいいじゃない?私のデータセットのサイズは、トレーニング用に 1600、テスト用に 400 に固定されています。

4

1 に答える 1

6

追加機能は、機能スペースでクラスを分離するのにまったく役立たない場合があるためです。精度は必ずしも機能の数に関係しているわけではありません。

不十分な機能を多数含めると、SVMがデータのノイズを学習し、精度が低下する可能性があります。

たとえば、追加の機能が次のようになっている場合(わかりやすくするために2Dプロットを使用):

class1 =赤、class2=青

その場合、(この場合は)2つのクラスを分離するための優れた機能にはなりません。たとえば、SVMがこのパターンのみでトレーニングする場合、将来のポイントのクラスを予測するのはあまり得意ではありません。ただし、データセットには次のような機能がある可能性があります。 class1 =赤、class2=青

このような機能は、2つのクラスを分離するのに非常に役立ちます。

于 2013-01-25T12:47:29.357 に答える