2

皆さん、libSVM を使って予測を行っていたときに奇妙な現象が発生しました。

SVM のパラメーターを設定しない場合、テスト セットで 99.9% のパフォーマンスが得られます。一方、パラメーター「-c 10 -g 5」を設定すると、テスト セットで約 33% の精度が得られます。

ちなみに、私が使っているSVMツールキットはLibSVMです。

データセットに何か問題があるのだろうか。そして、どちらの結果がより説得力があるかはわかりませんでした。

4

1 に答える 1

11

Cおよびのデフォルト値gamma(それぞれ 1 および 1/num_features) が適切に機能する問題がたまたま発生しました。

gamma=5デフォルト値よりも大幅に大きくなっています。gamma=5デフォルト値が最適に近い場合、 が非常に悪い結果を引き起こす可能性は十分にあります。gamma大規模と大規模の組み合わせはC、オーバーフィッティングの完璧なレシピです (たとえば、トレーニング セットのパフォーマンスが高く、テスト セットのパフォーマンスが低い)。

于 2013-05-20T12:56:41.080 に答える