分類問題で Vowpal Wabbit で作成されたモデルから、どのようにして精度、再現率、および f 測定値を取得しますか?
vw の出力でこれに一般的に使用される利用可能なスクリプトまたはプログラムはありますか?
playtennis.txt の次のデータを使用して最小限の例を作成するには:
2 | sunny 85 85 false
2 | sunny 80 90 true
1 | overcast 83 78 false
1 | rain 70 96 false
1 | rain 68 80 false
2 | rain 65 70 true
1 | overcast 64 65 true
2 | sunny 72 95 false
1 | sunny 69 70 false
1 | rain 75 80 false
1 | sunny 75 70 true
1 | overcast 72 90 true
1 | overcast 81 75 false
2 | rain 71 80 true
以下を使用してモデルを作成します。
vw playtennis.txt --oaa 2 -f playtennis.model --loss_function logistic
次に、トレーニング データ自体でトレーニング済みモデルの予測と生の予測を取得します。
vw -t -i playtennis.model playtennis.txt -p playtennis.predict -r playtennis.rawp
ここから先は、トレーニング データplaytennis.txt
と のトレーニング データに対する予測が与えられた場合に、精度、再現率、F 値を取得するために通常どのスクリプトまたはプログラムを使用しplaytennis.predict
ますか?
また、これがマルチラベル分類の問題 (各インスタンスが複数のターゲット ラベルを持つことができ、vw も処理できる) である場合、提案されたスクリプトまたはプログラムはこれらを処理できますか?