artificial-intelligence - ゲーム「近接」のための最適/十分な戦略とAIを見つけますか？

Question

「近接」は、オセロ、ゴー、リスクに似た領土支配の戦略ゲームです。2人のプレーヤー、10x12のヘクスグリッドを使用します。2007年にブライアンケーブルによって発明されたゲーム。

a）最適なアルゴリズム、b）AIの構築方法について議論するのにふさわしいゲームのようです。
戦略は、ランダム性係数と非常識な分岐係数（20 ^ 120）により、確率的またはヒューリスティックベースになります。したがって、客観的に比較するのは少し難しいでしょう。 1ターンあたり最大5秒の計算時間制限は妥当なようです=>これはすべてのブルートフォース攻撃を除外します。（ゲームのAIをエキスパートレベルでプレイして感触をつかんでください-いくつかの単純なヒューリスティックに基づいて非常に良い仕事をします）

ゲーム： Flashバージョンはこちら、iPhoneバージョンiProximityはこちら、ウェブ上の他の場所に多数のコピールール：こちら

オブジェクト：すべてのタイルが配置された後、ほとんどの軍隊を制御すること。空のヘックスボードから始めます。毎ターン、空いているボードスペースに配置するためにランダムに番号が付けられたタイル（1から20軍の間の値）を受け取ります。このタイルがALLYタイルに隣接している場合、それらのタイルの防御力を+1（最大値20まで）強化します。それがいずれかの敵タイルに隣接している場合、その数が敵タイルの数よりも多い場合、それはそれらを支配します。

戦略についての考え：ここにいくつかの最初の考えがあります。コンピューターのAIをエキスパートに設定すると、おそらく多くのことがわかります。

周囲を最小化することは、フリップを防ぎ、最悪の場合の損傷を最小限に抑えるための良い戦略のようです。
Goの場合と同様に、フォーメーション内に穴を残すことは致命的ですが、1回の移動で最大6マスの軍隊を失う可能性があるため、ヘクスグリッドの場合はさらに致命的です。
番号の小さいタイルは責任があるので、メインの領域から離れて、ボードの端の近くに配置し、散らばらせます。また、番号の小さいタイルを使用して、フォーメーションの穴を塞いだり、敵が攻撃する傾向がないように周囲に沿って小さなゲインを作成したりすることもできます。
3つのピースの三角形の形成は、相互に補強し、周囲を縮小するため、強力です。
各タイルは最大6回、つまり隣接するタイルが占有されているときに反転できます。フォーメーションの制御は前後に流れることができます。フォーメーションの一部を失い、穴を塞いでボードのその部分を「デッド」にし、領土をロックして/それ以上の損失を防ぐことがあります。
番号の小さいタイルは明らかですが、価値の低い負債ですが、番号の大きいタイルは、裏返されると（より困難になります）、より大きな負債になる可能性があります。20軍のタイルを使った1回の幸運なプレイでは、200のスイング（+100から-100軍）が発生する可能性があります。したがって、タイルの配置には、攻撃と防御の両方の考慮事項があります。

コメント1、2、4は、予想される最大の損失を最小化するミニマックス戦略に似ているようです（対戦相手が1..20から取得できる値ßの確率論的考察によって修正されます。つまり、ßによってのみ反転できる構造です。 = 20タイルは「ほとんど難攻不落」です。）コメント3、5、6が最適な戦略にどのような影響を与えるかはわかりません。Go、Chess、またはOthelloのプレーヤーからのコメントに興味があります。

（XBox Liveの続編ProximityHDは、4プレイヤーの協力的または競争力のあるローカルマルチプレイヤーを可能にします。これは、いつでも手札に5つのタイルがあり、そのうち1つしかプレイできないためです。味方のタイルの強化は味方ごとに+2に増加しました。）

score 3 · Accepted Answer

ここのU of A GAMESグループの元メンバー。

その分岐要因は正気ではありません。ゴーよりもはるかに悪い。

基本的に、あなたはフープされています。

このゲームの問題点は、タイルがランダムに選択されるため決定論的ではないことです。これにより、実際には、ツリー内の既存のノードの各レイヤーの間に別のノードのレイヤーが追加されます。*-Minimax に関する私の出版物に興味を持って、確率領域での検索手法を学んでください。

今世紀の終わりまでに 1 プライ検索を完了するには、非常に積極的なフォワードプルーニングテクニックが必要になります。明らかに最善の動きを早めに投げ出し、適切な動きの順序を構築することに集中してください。

score 2 · Accepted Answer

一般的なアルゴリズムについては、アルバータ大学の AI ゲームグループが行った調査を確認することをお勧めします。ただし、最適なものを見つけることに本当に興味があるとは思えません。そのゲームを韓国で販売したい場合を除き、「十分な」ものを目指してください:D

あなたの説明から、私はゲームが完全な可観測性を備えた 2 人のプレーヤーであると理解しました。アルバータ大学の連中によって提案されたミニマックス導関数を検索します。ただし、値関数のバックアップの深さをバウンドできるようにすることは、ゲームに「難易度」を追加するための良い方法かもしれません。彼らは、価値関数の推定値を改善するために検索空間をサンプリングすることについて、いくつかの作業を行ってきました-少し怪しいものです。

あなたが説明する「戦略」セクションについて：私が言及しているフレームワークでは、その知識を評価関数としてエンコードする必要があります。このような知識工学の例については、Michael Büro など (同じく U Alberta グループ) の研究を見てください。

別の可能性は、問題を強化学習の問題として提起することです。この場合、敵の動きは「アフターステート」としてコンパイルされます。Barto & Sutton の本を参照してください: http://webdocs.cs.ualberta.ca/~sutton/book/the-book.htmlただし、そのようなコンパイルから生じる RL 問題の値関数は、少し難しいことがわかります。最適に解決する - 状態の数は水爆のように爆発します。ただし、因数分解された表現の使用方法がわかれば、作業ははるかに簡単になります。そして、あなたの「戦略」は、学習プロセスを大幅にスピードアップする何らかの整形関数としてエンコードされる可能性があります。

編集：いまいましい英語の前置詞

artificial-intelligence - ゲーム「近接」のための最適/十分な戦略とAIを見つけますか？

2 に答える 2

Related

Reference