不均衡なデータがあり、matlab で LibSVM を使用したいと考えています。LibSVM には、-c と -wi という 2 つの異なるコスト パラメータがあります。それらの違いは何ですか?
質問する
344 次
1 に答える
0
-cオプションは、ハイパーパラメータ値を設定します。データが不均衡であるため、例の数が少ないクラスと比較して、例の数が多いクラスのエラーを最小限に抑えようとします。
さて、一方向は、例の数が少ないクラスのエラーには、他のクラスと比較してより多くの重みを与える必要があることをアルゴリズムに何らかの形で提案することです。これを行うには、 -wオプションを使用します。
説明:+1と-1の2つのクラスがあります。+1の例は、-1クラスに比べて数が少ないため、+1クラスにより多くの重みを与える必要があります。これで、パラメータをとして設定できます。これは、
-w+1 10 -c C
正のクラスのエラーに、二項分類の負のクラスの約10倍の重みを与える必要があることを示します。-c
で使用される値および-wは、交差検定手法を使用して選択されます。
于 2013-01-21T07:41:17.160 に答える