SVM を使用して vowpal wabbit でバギングまたはブースティングを使用するにはどうすればよいですか。
私の現在の結果は、90% の再現率と 10% の精度です。
vw -d train.dat -c compressed --passes 10 --oaa 3 -f train.model --loss_function hinge
バギング/ブースティングを使用して精度を高めたい
SVM を使用して vowpal wabbit でバギングまたはブースティングを使用するにはどうすればよいですか。
私の現在の結果は、90% の再現率と 10% の精度です。
vw -d train.dat -c compressed --passes 10 --oaa 3 -f train.model --loss_function hinge
バギング/ブースティングを使用して精度を高めたい
ブースト用--boosting N
(最近追加されたので、GitHubのVWを使用)。バギングには、 を使用します--bootstrap M
。Vowpal Wabbit の勾配ブースティングを参照してください。
3 つのクラスに分類するために再現率と適合率を定義する方法がわかりません。ここでは、標準のバイナリ分類 (正と負の 2 つのクラス) があり、F1 スコア (適合率と再現率の調和平均) を最適化し、適合率が 10%、再現率が 90% であるとします。したがって、肯定的に予測された例の 10% だけが本当に肯定的です。(これは、不均衡なデータ、またはトレーニング データと比較してテスト データの正の例の割合が異なることが原因である可能性があります。) その場合、負の例 ( VW wikiの [Importance] を参照) の重要度の重みを増やすことをお勧めします (または肯定的な例の重要性を減らします)。