アクション変数のみが異なる2つの異なるセットに対して、コンテキストバンディットアプローチを実行しています。モデルを構築する 1 つのセット (klaster3.model) には 6 つの異なるアクション タイプがあり、モデルも構築するもう 1 つのセット (klaster8.model) には 7 つの異なるアクション タイプがあります。
head testLabels -n 1 | vw -i klaster8.model -t -p /dev/stdout --quiet
コマンドラインで
そのような行を実行すると
5.000000 Mloda_kobieta
、そのコンテキストのポリシーから選択されたアクションのように見えます。
しかし、-a
(audit) オプションを使用して同じコードを試すと、次のような出力が表示されます。
0.943965 Mloda_kobieta
Constant:142055:1:0.50745 ^K:136407:1:0.236886 ^Young:101199:1:0.199628
0.994175 Mloda_kobieta
Constant:142056:1:0.488827 ^K:136408:1:0.281023 ^Young:101200:1:0.224326
0.948740 Mloda_kobieta
Constant:142057:1:0.482498 ^K:136409:1:0.2568 ^Young:101201:1:0.209442
0.979921 Mloda_kobieta
Constant:142058:1:0.497253 ^K:136410:1:0.241421 ^Young:101202:1:0.241247
0.910945 Mloda_kobieta
Constant:142059:1:0.506602 ^K:136411:1:0.208468 ^Young:101203:1:0.195875
1.004143 Mloda_kobieta
Constant:142060:1:0.49813 ^K:136412:1:0.280554 ^Young:101204:1:0.225459
0.934807 Mloda_kobieta
Constant:142061:1:0.494118 ^K:136413:1:0.240735 ^Young:101205:1:0.199954
0.953710 Mloda_kobieta
Constant:142048:1:0.582269 ^K:136400:1:0.213502 ^Young:101192:1:0.15794
0.994442 Mloda_kobieta
Constant:142049:1:0.526175 ^K:136401:1:0.243671 ^Young:101193:1:0.224595
0.944228 Mloda_kobieta
Constant:142050:1:0.504455 ^K:136402:1:0.22308 ^Young:101194:1:0.216693
0.979964 Mloda_kobieta
Constant:142051:1:0.521737 ^K:136403:1:0.233687 ^Young:101195:1:0.22454
0.907704 Mloda_kobieta
Constant:142052:1:0.547686 ^Young:101196:1:0.186401 ^K:136404:1:0.173617
1.004132 Mloda_kobieta
Constant:142053:1:0.549014 ^K:136405:1:0.247787 ^Young:101197:1:0.207331
0.937724 Mloda_kobieta
Constant:142054:1:0.525254 ^K:136406:1:0.236784 ^Young:101198:1:0.175686
5.000000 Mloda_kobieta
これは、このコンテキストのアクションの何らかのスコアリングのように見えます。私の意見では、スコアリングが最も少ないアクションを選択する必要があります (これは、この例ではアクション 5 です)。このデータセットには7つの異なるacionタイプしかないのに、なぜ14行あるのだろうか? そして、6 つの異なるアクション タイプがあるのに、なぜ 12 行を受け取るのでしょうか。number_of_different_acion_types*2 のように見えます。私の場合、説明変数は年齢と性別の 2 つだけです。
質問は次のとおりです。
1) 監査 (-a) を使用した出力の行数は次の式に対応していますか: number_of_different_acion_types*number_of_explanatory_variables
2) はいの場合、最初の 7 行 (その例では) は最初の変数に対応し、他の 7 行は 2 番目の変数に対応しますか?
3) 出力の順序を知る方法は? どの変数が 1 番目として処理され、どの変数が 2 番目として処理されますか? 入力データセットの列の順序に対応していますか?
4) 最初の 7 行が 1 番目の変数のコスト係数に対応し、他の 7 行が 2 番目の変数のコスト係数に対応する場合、出力ポリシーはこれらの係数の合計が最小のアーム/アクションを選択しますか? (2 つの変数があるため、各アクションには 2 つの係数があります)。
出力の順序が入力の列の順序に対応している疑いがありますが、よくわかりません。
ご回答ありがとうございます。