たとえば、一連の数字がある 2 プレーヤーのゲームがあります2 -6 12
。それらがカードに書かれているとしましょう。
ゲームは順番に時間がかかります。各ターン プレイヤーは、シーケンスの最初または最後から正確に 1 枚のカードを取得する義務があります (スキップなし)。最後のカードが取られた後、ゲームは終了します。目標は、できるだけ高い正のスコアでゲームを終了することです (スコアは、プレイヤーが取ったカードのすべての数字の合計です)。また、両方のプレーヤーが最適な戦略を使用してプレイしていることもわかっています (利益を最大化するため)。彼らが最終的にどのスコアに到達するかを言わなければなりません。
最適な戦略がどのように見えるか考えていますか?
これまでの私の研究:
1-3 cards is trivial
{a}, no choice take a;
{a,b} take max(a,b) reduces to problem {a}
{a,b,c} take max(a,c) reduces to problem {a,b}
4 cards : {a,b,c,d}
if (a + max(c, min(b,d)) > d + max(b, min(a,c)))
take a;
else
take d;
私が取ることに決めた場合a
、対戦相手は 3 枚のカードの戦略が示すように max(b,d) を取るので、私がしなければならないことは (対戦相手のターン中に「安全」である) から最大のカードを取り、 のカードc
から小さくすることです。より大きなものを取るでしょう。との双子の状況。しかし、n-cards の場合に (可能であれば) 展開する方法がわかりません。b
d
d
手がかりはありますか?