vowpalwabbit - コンテキストバンディットモードで -a (監査) オプションを使用して vw 出力を解釈するにはどうすればよいですか?

Question

アクション変数のみが異なる2つの異なるセットに対して、コンテキストバンディットアプローチを実行しています。モデルを構築する 1 つのセット (klaster3.model) には 6 つの異なるアクションタイプがあり、モデルも構築するもう 1 つのセット (klaster8.model) には 7 つの異なるアクションタイプがあります。

head testLabels -n 1 | vw -i klaster8.model -t -p /dev/stdout --quiet コマンドラインでそのような行を実行すると 5.000000 Mloda_kobieta 、そのコンテキストのポリシーから選択されたアクションのように見えます。

しかし、-a(audit) オプションを使用して同じコードを試すと、次のような出力が表示されます。

0.943965 Mloda_kobieta Constant:142055:1:0.50745 ^K:136407:1:0.236886 ^Young:101199:1:0.199628 0.994175 Mloda_kobieta Constant:142056:1:0.488827 ^K:136408:1:0.281023 ^Young:101200:1:0.224326 0.948740 Mloda_kobieta Constant:142057:1:0.482498 ^K:136409:1:0.2568 ^Young:101201:1:0.209442 0.979921 Mloda_kobieta Constant:142058:1:0.497253 ^K:136410:1:0.241421 ^Young:101202:1:0.241247 0.910945 Mloda_kobieta Constant:142059:1:0.506602 ^K:136411:1:0.208468 ^Young:101203:1:0.195875 1.004143 Mloda_kobieta Constant:142060:1:0.49813 ^K:136412:1:0.280554 ^Young:101204:1:0.225459 0.934807 Mloda_kobieta Constant:142061:1:0.494118 ^K:136413:1:0.240735 ^Young:101205:1:0.199954 0.953710 Mloda_kobieta Constant:142048:1:0.582269 ^K:136400:1:0.213502 ^Young:101192:1:0.15794 0.994442 Mloda_kobieta Constant:142049:1:0.526175 ^K:136401:1:0.243671 ^Young:101193:1:0.224595 0.944228 Mloda_kobieta Constant:142050:1:0.504455 ^K:136402:1:0.22308 ^Young:101194:1:0.216693 0.979964 Mloda_kobieta Constant:142051:1:0.521737 ^K:136403:1:0.233687 ^Young:101195:1:0.22454 0.907704 Mloda_kobieta Constant:142052:1:0.547686 ^Young:101196:1:0.186401 ^K:136404:1:0.173617 1.004132 Mloda_kobieta Constant:142053:1:0.549014 ^K:136405:1:0.247787 ^Young:101197:1:0.207331 0.937724 Mloda_kobieta Constant:142054:1:0.525254 ^K:136406:1:0.236784 ^Young:101198:1:0.175686 5.000000 Mloda_kobieta

これは、このコンテキストのアクションの何らかのスコアリングのように見えます。私の意見では、スコアリングが最も少ないアクションを選択する必要があります (これは、この例ではアクション 5 です)。このデータセットには7つの異なるacionタイプしかないのに、なぜ14行あるのだろうか? そして、6 つの異なるアクションタイプがあるのに、なぜ 12 行を受け取るのでしょうか。number_of_different_acion_types*2 のように見えます。私の場合、説明変数は年齢と性別の 2 つだけです。

質問は次のとおりです。

1) 監査 (-a) を使用した出力の行数は次の式に対応していますか: number_of_different_acion_types*number_of_explanatory_variables

2) はいの場合、最初の 7 行 (その例では) は最初の変数に対応し、他の 7 行は 2 番目の変数に対応しますか?

3) 出力の順序を知る方法は? どの変数が 1 番目として処理され、どの変数が 2 番目として処理されますか? 入力データセットの列の順序に対応していますか?

4) 最初の 7 行が 1 番目の変数のコスト係数に対応し、他の 7 行が 2 番目の変数のコスト係数に対応する場合、出力ポリシーはこれらの係数の合計が最小のアーム/アクションを選択しますか? (2 つの変数があるため、各アクションには 2 つの係数があります)。

出力の順序が入力の列の順序に対応している疑いがありますが、よくわかりません。

ご回答ありがとうございます。

vowpalwabbit - コンテキスト バンディット モードで -a (監査) オプションを使用して vw 出力を解釈するにはどうすればよいですか?

0 に答える 0

Related

Reference

vowpalwabbit - コンテキストバンディットモードで -a (監査) オプションを使用して vw 出力を解釈するにはどうすればよいですか?