情報が不完全なゲーム、特に Bridge や Doppelkopf のようなトリックテイキング ゲームの一般的な戦略はありますか?
そのようなゲームに AI 戦略を実装する方法に興味があります。
報奨金は、特定の戦略を最もよく説明した回答に対するものです。
情報が不完全なゲーム、特に Bridge や Doppelkopf のようなトリックテイキング ゲームの一般的な戦略はありますか?
そのようなゲームに AI 戦略を実装する方法に興味があります。
報奨金は、特定の戦略を最もよく説明した回答に対するものです。
強化学習スキーマの実装を試すことができます。たくさんの数学が必要ですが、使うのはいいことです。
編集:RLに関する優れたリソースへのリンクは次のとおりです。
RLを使用して、AIにとって重要なものと無視すべきものをフィルタリングできます。あなたのAIは彼の過ちから学びますが、時間内に学び、そのゲームにとって何が重要で何が重要でないかを知るでしょう。
Edit2:一言で言えば、RLを使用すると、エージェントは、私たち人間が学ぶのと同じように、彼の経験から学ぶことができます。私たちは一度燃やします-私たちは火に触れないようにします。私たちは何かをした後に報酬を受け取ります-私たちはより多くの報酬のためにそれを続けます。RLを使用するエージェントについても同じです。
このような問題にはExpectimaxが一般的に使われていると思います。戦略は、対戦相手のスコアの最悪の場合の期待値を最小限に抑えることです。
「不完全な情報」を持つ問題は、「エキスパート システム」またはフィルタリング メカニズムで適切に対処される傾向があります。「ゲーム理論」は単に「結果の最適化」(他のすべてを犠牲にして何かを最適化すること) に関連しているため、エキスパート システムのようなアプローチでさえ、実際のユーザー インタラクティブ ゲームに体系化できることを思い出してください。
「不完全な情報」の「エキスパート システム」の例は、次のようになります 。新しい車が必要です。 ユニバースは、すべての「既知の」車、または動的に (おそらくランダムに) 生成された「可能性のある」車のセット (たとえば、さまざまな機能/モデル、さまざまなメーカー、さまざまな機能など) から始まります。その後、システムは質問をすることができます。 、 お気に入り:
質問: 最も重要なことは何ですか?
重要なことは、「わからない」ということです。回答によって「フィルタリング」操作(たとえば、利用可能な車から可能な車を削除する)または「ランキング」操作が行われるため、すべての質問のオプションにする必要があります。 (たとえば、いくつかを他のものよりも「優先」としてソートします)。
ゲームエンジンに特に適用されるため、「可能性の宇宙」を確立します。たとえば、歩いて行ける廊下、ボード上のタイル、考えられるすべての向き、使用できるすべての「武器」、考えられるすべての「敵」などです。個人」または「敵グループ」など。
次に、ゲームのダイナミクスに基づいて、あなたの仕事は次のことだけです。
このタイプの AI が非常にうまく機能する理由は、「ファジー数学」ドメイン (独自の優れた Google 検索) に関連しています。そこでは、自分が持っている情報を考慮する (またはシステムを汚染する) ことなく、不完全な情報をインテリジェントに適用できます。持っていないだけでなく、情報のアトミック単位をそれほど「信頼」していません(フィルタリングとソートは、時間の経過とともにエラーを「平均化」する傾向があるため)。
フィルタリングとソートに「時間係数」を設定すると、(古い質問への回答はますます「疑わしい」と見なされ、「フィルタリングされた」または「一番下にソートされた」古いアイテムはますます増加しています)可能性が戻ってくる)、非常に興味深く、ダイナミックで、無限に実行されるゲームを得ることができます。
そして、その「動的」で「無限に実行中」のゲームは、一部のゲームにある確率的要素を追加する前のものです。Minefield、Battleship、Stratego などのゲームは、ゲームの実行中にほとんど変更されないため、(非常に) 長時間実行されるゲームでは、「ローカライズされた時間減衰の回答」で十分な場合があります。ただし、新しい敵をランダムに生成したり、敵が動き回ったり、「ボードのセットアップ」に他のランダムなコンポーネントがある場合 (一部のパスが時々しか利用できない海の潮のように)、まったく新しいレベルの複雑さが追加されます。 .
経路を覆い隠す海の潮汐は、疑似定期的または疑似ランダム化されたスケジュールである可能性があります。ただし、「エキスパート システム」または「フィルタリング」の概念は、(おそらく無限の) 「イベント」のセット (「海の潮汐」が「イベント」である) があり、同様にフィルタリングと順序付けを適用することを示唆しています。 RIGHT NOW イベントを選択するには (フィルタリングと順序付けを使用して、他のすべてのイベント以外のオプションとは対照的に、「イベント」が発生する必要があると判断した後)。
私は一般的な戦略を認識していませんが、隠れた動きとまともな AI を備えたゲームを実装しました。
AI は、考えられるすべての攻撃対象を調べ、その動きが集中していると思われる対象を特定することで、人間が何をしようとしているのかを理解しようとしました。AI は、可能であれば強化を試みるか、保持が期待できない場合は避難を試みます。
一度に2つのターゲットを攻撃することでおとりになることもありますが、これは通常、攻撃が弱いことを意味し、すでに勝っていない限り、うまく機能しませんでした.
私がコピーを渡したほとんどの人が同等でそれを打ち負かすことができなかったのは十分に困難でした.