私はLibSVMを使用して、非常に不均衡なデータセットでSVMをトレーニングしています。出力の10%は真であり、90%は偽です。私は体重パラメータについて読みました:
-wi weight: set the parameter C of class i to weight*C, for C-SVC (default 1)
各クラスのパラメータセットは何ですか?この重みパラメータは直感的に何を意味し、どのように使用する必要がありますか?
私はLibSVMを使用して、非常に不均衡なデータセットでSVMをトレーニングしています。出力の10%は真であり、90%は偽です。私は体重パラメータについて読みました:
-wi weight: set the parameter C of class i to weight*C, for C-SVC (default 1)
各クラスのパラメータセットは何ですか?この重みパラメータは直感的に何を意味し、どのように使用する必要がありますか?
重みパラメーターは、SVM最適化の偏りを制御します。つまり、重みが大きいクラスの方がカウントされます。クラスの重みが別のクラスの3倍である場合、より低い重みのクラスのインスタンスは、libsvmが他のクラスのインスタンスとして決定するクラス間の境界から3倍離れている可能性があります。同じ最適化値。
これをどのように使用するかは完全にあなた次第です-2つのクラスが等しく重み付けされるように設定できます(つまり、真の場合は9の重み)が、これで得られる結果が実際に同じ重みを使用することで改善される場合は、別の問題。
何が起こるかを確認するために、さまざまな重みで遊んでみることをお勧めします。