algorithm - ゲームの結果を重み付けするための式/アルゴリズム

Question

興味深い概念上の問題があり、誰かがそれを定量化するのを手伝ってくれるかどうか疑問に思っています. 基本的に、私は一連のゲームをプレイしています...各ゲームで、勝つ確率、引き分けの確率、負ける確率を知っています (各ゲームの確率は異なります)。

大まかに言うと、私が知りたいのは、どのゲームに注意を向けるべきかということです。たとえば、勝つ可能性が 0% のゲーム (または勝つ可能性が 100% のゲーム) には力を入れません。しかし、50/50 のゲームでは、私は多くのことに気を配り、最大限の努力をしたいと考えています。同点でなければ、次のように単純になります。しかし、関係があると、事態は複雑になります。

厳密に必要かどうかはわかりませんが、必要な場合は、勝利は 0 ポイント、引き分けは 1 ポイント、勝利は 2 ポイントと仮定できます。言い換えれば、負けから引き分けになることは、引き分けから勝ちになることと同じくらい価値があるということです。

すべてのゲームが独立していると仮定することもできます。基本的に、私は「ケア能力」の定量的指標 (たとえば、0 から 1 までの値) を探しているだけです。

このようなものにアプローチする方法について、誰かアイデアはありますか? あなたが経済学者なら、ゲームに勝つ可能性を高めるために使える金額は限られていると想像できます。期待される結果を最大化するために、これらの資金をゲーム全体にどのように配分しますか?

前もって感謝します！

編集：申し訳ありませんが、これはかなり不十分な表現の質問であることに気づきました。追加投資と生産された結果との関係は特定しません。直線的な関係であると仮定したかったのですが、その場合、どのゲームに投資しても、期待値は常に同じように増加するので問題ありません。私の実際の問題はもう少し複雑で、少し考え直す必要があります。助けてくれて素晴らしいアイデアをくれたみんなに感謝します！

score 1 · Accepted Answer

これを制約付き最適化問題として定式化できます。

今のところドローは無視します...

したがって、最初に行う必要があるのは、ゲーム i に費やす金額を a_i とすることです。

ゲーム i に勝つ可能性は、おそらく a_i の関数です.. p_i(a_i) と呼びます

ゲーム i の予想ペイアウトは 2 * p_i(a_i) です。

したがって、予想される支払いの合計は P = 2* Sum( p_i(a_i) ) です。

支出額にはいくつかの制約があります... sum(a_i) = A

あなたの目的は、制約に従って P を最大化することです。

Lagrange 法を使用すると、未知数 a_i と lambda について、N+1 個の方程式を同時に解くことができます。

N 式は次のようになります。

 2 p_i'(a_i) = lambda

そして、1 つの制約方程式

 sum(a_i) = total

これらをどのように解決するかは、p_i 関数の構造によって異なります。構造または p_i 関数によっては、各 a_i > 0 という追加の制約を導入する必要がある場合があります。方程式を解くのがはるかに難しくなるため、それを避けるために p_i を構造化しようと思います。

引き分けの可能性を導入したい場合は、p_i(a_i) を w_i(a_i) と d_i(a_i) に分割し、ゲームごとの支払いを 2 * w_i(a_i) + 1 * d_i(a_i) に変更します。 . ただし、これはコアの数学を変更しません。

score 0 · Accepted Answer

しかし、50/50 のゲームでは、私は多くのことに気を配り、最大限の努力をしたいと考えています。同点でなければ、次のように単純になります: 「世話能力」 = 50% に近い勝率しかし、関係があると、事態は複雑になります。

私はそうは思わない。勝率が 50/50 のゲームを探している場合は、「勝つ可能性と 50%に引き分けられる可能性の半分を加えたものにどれだけ近いか」を計算しているだけではありませんか? それとも、あなたの質問を誤解していますか?

編集：

式は次のようになります。

x = 1 - abs(0.5-abs(win% + tie%/2));
                 ^ the inner 'abs' here may be useless, but i'm not sure ;)

score 0 · Accepted Answer

あなたが考慮する必要があると私が考えることができる最も明白なことは、確率を変えるためにどれだけのリソース（労力、お金、その他）が必要かということです.

簡単な例としてドルを使用すると、現在の勝率が 0% のゲームで、1 ドルで 50% の勝率が得られる場合は、その 1 ドルで 50% の勝率が得られる場合よりも優れた選択肢となります。 99%の確率。

大まかに言うと、各ゲームの勝ち/引き分け/負けに値を適用する必要があると思います (既に述べたように)。次に、現在の予想合計値を計算できます (例: 50% 勝ち、25% 引き分け、25% 負けの場合、0.5*2+0.25*1+0.25*0 = 1.25 期待ポイント)。目標は、総期待値を可能な限り改善するためにすべてのリソースを使用することです。

この最後のステップは、機能を成功させるためのリソースに完全に依存しています。この関数を分析すると、簡単な解決策になるかもしれません。

いくつかの努力式の例:

1) 線形 - 1 単位のリソースで、勝率と引き分け率が X 倍になります。

これは、負ける可能性を排除していない限り、どこに力を入れても問題ないことを意味します。負けるかもしれないどんな試合にも全力を注ぎましょう。

2) 逆 - 勝つ/引く可能性が低いほど、利益が高くなります

1 単位の努力が「X/win チャンス」の増加をもたらし、勝率が上がる場合、最悪のゲームをブーストすることで最大の利益を得られることは明らかです。

3) ミッドポイントの傾向 - 勝敗が同じに近づくほど、より多くの利益が得られます。

これは、勝つ可能性が非常に高い、または負ける可能性が非常に高いゲームは、改善される可能性が最も低いという事実をシミュレートします (誰かがあなたよりもはるかに優れている場合、その努力はおそらく重要ではありません)。このシナリオでは、最大の増加を得るために、勝敗の可能性がほぼ等しい人に集中する必要があります。

これが理にかなっていることを願っています。:)

algorithm - ゲームの結果を重み付けするための式/アルゴリズム

3 に答える 3

Related

Reference