algorithm - 8パズル問題を解決するための効率的なアプローチは何ですか?

Question

8 パズルは、9 つの位置を持つ正方形のボードで、8 つの数字のタイルと 1 つの隙間で埋められます。いつでも、ギャップに隣接するタイルをギャップに移動して、新しいギャップ位置を作成できます。つまり、ギャップは隣接する (水平方向および垂直方向に) タイルと交換できます。ゲームの目的は、タイルの任意の構成から始めて、ボードの周囲を走るか、左上に 1 を付けて左から右に並べるか、昇順で配置された番号のタイルを取得するようにそれらを移動することです。・手の位置。

8パズル

この問題を解決するにはどのようなアプローチが効率的でしょうか?

score 15 · Accepted Answer

以前の回答を書き直して、それが最適である理由について詳しく説明します。

ウィキペディアから直接取得した A* アルゴリズムは次のとおりです。

            function A*(start,goal)
                    closedset := the empty set                 // The set of nodes already evaluated.     
                    openset := set containing the initial node // The set of tentative nodes to be evaluated.
                    came_from := the empty map                 // The map of navigated nodes.
                    g_score[start] := 0                        // Distance from start along optimal path.
            h_score[start] := heuristic_estimate_of_distance(start, goal)
                    f_score[start] := h_score[start]           // Estimated total distance from start to goal through y.
                    while openset is not empty
                    x := the node in openset having the lowest f_score[] value
                    if x = goal
            return reconstruct_path(came_from, came_from[goal])
                    remove x from openset
                    add x to closedset
            foreach y in neighbor_nodes(x)
                    if y in closedset
                    continue
            tentative_g_score := g_score[x] + dist_between(x,y)

                    if y not in openset
                    add y to openset
                    tentative_is_better := true
                    elseif tentative_g_score < g_score[y]
                    tentative_is_better := true
                    else
                    tentative_is_better := false
                    if tentative_is_better = true
                    came_from[y] := x
                    g_score[y] := tentative_g_score
            h_score[y] := heuristic_estimate_of_distance(y, goal)
                    f_score[y] := g_score[y] + h_score[y]
                    return failure

            function reconstruct_path(came_from, current_node)
                    if came_from[current_node] is set
                    p = reconstruct_path(came_from, came_from[current_node])
            return (p + current_node)
                    else
                    return current_node

それでは、ここにすべての詳細を記入させてください。

heuristic_estimate_of_distanceは関数 Σ d(x _{i ) です。ここで、d(.) は各正方形 x}_iのゴール状態からのマンハッタン距離です。

というわけでセットアップ

            1 2 3
            4 7 6
            8 5

heuristic_estimate_of_distanced(.)=1 で 8,5 のそれぞれがゴール位置から 1 離れており、d(7)=2 で 7 がゴール状態から 2 離れているため、aは 1+2+1=4 になります。

A* が検索するノードのセットは、開始位置の後にすべての有効な位置が続くように定義されます。つまり、開始位置xが上記のようになっているとしましょう。

次に、関数neighbor_nodes(x)は 2 つの有効な動きを生成します。

関数は、状態からdist_between(x,y)に遷移するために発生した四角移動の数として定義されます。これは、アルゴリズムの目的上、常に A* の 1 に等しくなります。xy

closedsetopensetどちらも A* アルゴリズムに固有であり、標準のデータ構造 (私が信じているプライオリティキュー) を使用して実装できます。詳細はウィキペディアで見つけることができるcame_from関数 who を使用して見つかったソリューションを再構築するために使用されるデータ構造です。reconstruct_path解決策を覚えたくない場合は、これを実装する必要はありません。

最後に、最適性の問題について説明します。A* ウィキペディアの記事からの抜粋を考えてみましょう。

「ヒューリスティック関数 h が許容可能である場合、つまり、目標に到達するための実際の最小コストを過大評価しないことを意味し、閉集合を使用しない場合、A* 自体が許容可能 (または最適) です。閉集合が使用されている場合、 A* が最適であるためには、h も単調 (または一貫性) である必要があります. これは、d(x,y) がそれらの間のエッジの長さを表す場合、隣接するノード x と y の任意のペアについて、次の条件を満たさなければならないことを意味します: (x) <= d(x,y) +h(y)"

したがって、ヒューリスティックが許容可能で単調であることを示すだけで十分です。前者 (許容性) については、任意の構成が与えられた場合、ヒューリスティック (すべての距離の合計) は、各正方形が正当な移動のみによって制約されず、そのゴール位置に向かって自由に移動できると推定することに注意してください。これは明らかに楽観的な推定です。したがって、ヒューリスティック許容されます (または、目標位置に到達するには常に少なくともヒューリスティック推定と同じ数の移動が必要になるため、過大評価することはありません)。

単調性要件を言葉で表すと、「任意のノードのヒューリスティックコスト (目標状態までの推定距離) は、隣接するノードに遷移するコストにそのノードのヒューリスティックコストを加えた値以下でなければなりません。」

これは主に、関連のないノードへの遷移が、実際に遷移を行うコストよりも目標ノードまでの距離を縮める可能性がある負のサイクルの可能性を防ぐためのものであり、不十分なヒューリスティックを示唆しています。

私たちの場合、単調性を示すのは非常に簡単です。隣接するノード x,y は、d の定義により d(x,y)=1 になります。したがって、私たちは示す必要があります

h(x) <= h(y) + 1

これはと同等です

h(x) - h(y) <= 1

これはと同等です

Σ d(x _i ) - Σ d(y _i ) <= 1

これはと同等です

Σ d(x _i ) - d(y _i ) <= 1

neighbor_nodes(x)2 つの隣接ノード x、y の位置が最大で異なる 1 つの正方形の位置を持つことができるという定義により、合計で項が

d(x _i ) - d(y _i ) = 0

i の 1 つの値を除くすべての値。一般性を失うことなく、これは i=k に当てはまるとしましょう。さらに、i=k の場合、ノードは最大で 1 つの場所に移動したことがわかっているため、目標状態までの距離は、前の状態よりも最大で 1 つ大きくなければなりません。

Σ d(x _i ) - d(y _i ) = d(x _k ) - d(y _k ) <= 1

単調さを示しています。これは、何を表示する必要があるかを示しているため、このアルゴリズムが最適であることを証明しています (big-O 表記法または漸近的な方法で)。

big-O 記法に関しては最適性を示しましたが、ヒューリスティックを微調整するという点ではまだ多くの余地があることに注意してください。さらにひねりを加えて、目標状態までの実際の距離をより正確に見積もることができますが、ヒューリスティックが常に過小評価であることを確認する必要があります。そうしないと、最適性が失われます!

後で多くの月を編集する

これを（ずっと）後で読み直して、私が書いた方法が、このアルゴリズムの最適性の意味を混乱させていることに気付きました。

私がここで得ようとしていた最適性の 2 つの異なる意味があります。

1) アルゴリズムは最適解を生成します。これは、客観的な基準が与えられた場合に考えられる最善の解です。

2) アルゴリズムは、同じヒューリスティックを使用して、可能なすべてのアルゴリズムの最小数の状態ノードを展開します。

1) を取得するためにヒューリスティックの許容性と単調性が必要な理由を理解する最も簡単な方法は、A* をダイクストラの最短経路アルゴリズムのアプリケーションとして表示することです。ここで、エッジの重みは、これまでに移動したノード距離とヒューリスティックによって与えられます。距離。これらの 2 つのプロパティがなければ、グラフに負のエッジがあり、負のサイクルが発生する可能性があり、ダイクストラの最短経路アルゴリズムは正しい答えを返さなくなります! (自分自身を納得させるために、これの簡単な例を作成してください。)

2) 実際には理解するのが非常に紛らわしいです。この意味を完全に理解するために、このステートメントには多くの量指定子があります。たとえば、他のアルゴリズムについて話すときは、similarノードを展開し、アプリオリな情報なしで (ヒューリスティック以外の) 検索するアルゴリズムを A* と呼びます。明らかに、道のあらゆる段階で答えを教えてくれるオラクルや魔神など、ささいな反例を作成することもできます。この声明を深く理解するには、ウィキペディアの歴史セクションの最後の段落を読み、その慎重に述べられた文のすべての引用と脚注を調べることを強くお勧めします.

これにより、読者になる予定の読者の間で残っている混乱が解消されることを願っています.

score 11 · Accepted Answer

数値の位置に基づくヒューリスティックを使用できます。つまり、各文字の目標状態からのすべての距離の合計が高いほど、ヒューリスティック値が高くなります。次に、時間と空間の複雑さの点で最適な検索であることが証明できる A* 検索を実装できます (ヒューリスティックが単調で許容できる場合) http://en.wikipedia.org/wiki/A*_search_algorithm

score 6 · Accepted Answer

OPは写真を投稿できないため、これは彼が話していることです：

8 パズル - 初期状態

このパズルを解く限り、このページで8パズル問題に関連するように、反復的な深化の深さ優先検索アルゴリズムを見てください。

score 4 · Accepted Answer

これは、古典的な最短経路アルゴリズムの例です。最短経路の詳細については、こちらとこちらをご覧ください。

要するに、パズルのすべての可能な状態を、あるグラフの頂点として考えてください。移動するたびに状態が変化するため、有効な移動はそれぞれグラフのエッジを表します。移動にはコストがないため、各移動のコストは 1 と考えることができます。次の C++ に似た疑似コードは、この問題に対して機能します。

{
int[][] field = new int[3][3];
//  fill the input here
map<string, int> path;
queue<string> q;
put(field, 0); // we can get to the starting position in 0 turns
while (!q.empty()) {
    string v = q.poll();
    int[][] take = decode(v); 
    int time = path.get(v);
    if (isFinalPosition(take)) {
        return time;
    }
    for each valid move from take to int[][] newPosition {
        put(newPosition, time + 1);
    }
}
// no path
return -1;
}

void isFinalPosition(int[][] q) {
    return encode(q) == "123456780"; // 0 represents empty space
}
void put(int[][] position, int time) {
    string s = encode(newPosition);
    if (!path.contains(s)) {
        path.put(s, time);
    }
}

string encode(int[][] field) {
    string s = "";
    for (int i = 0; i < 3; i++) for (int j = 0; j < 3; j++) s += field[i][j];
    return s;
}

int[][] decode(string s) {
    int[][] ans = new int[3][3];
    for (int i = 0; i < 3; i++) for (int j = 0; j < 3; j++) field[i][j] = s[i * 3 + j];
    return ans;
}

score 4 · Accepted Answer

ドーナツができた！このパズルの検索スペースが比較的限られていることを考えると、IDDFS はそのトリックを実行します。効率的であるため、OPの質問に回答します。最適なソリューションが見つかりますが、必ずしも最適な複雑さではありません。

IDDFS の実装は、この問題のより複雑な部分になります。ボードやゲームのルールなどを管理するための簡単なアプローチを提案したいと思います。これは特に、解決可能なパズルの初期状態を取得する方法に対処します。質問のメモで示唆されているように、9 タイトルのすべてのランダムな割り当て (空のスロットを特別なタイルと見なす) では解決可能なパズルが得られません。それは数学的パリティの問題です...したがって、ゲームをモデル化するための提案は次のとおりです。

ゲームの有効な「動き」を表すすべての 3x3 順列行列のリストを作成します。このようなリストは、すべてゼロと 2 つの 1 を含む 3x3 のサブセットです。各マトリックスは、IDDFS 検索ツリーで移動を追跡するのに非常に便利な ID を取得します。行列の代わりに、タイル位置番号の 2 つのタプルを交換することです。これにより、実装が高速化される可能性があります。

このようなマトリックスを使用して、最初のパズル状態を作成し、「勝利」状態から始めて、ランダムに選択された任意の数の順列を実行できます。このアプローチは、初期状態が解決可能であることを保証するだけでなく、特定のパズルを解決できる手数の指標も提供します。

IDDFS アルゴを実装して、[冗談]A+ の代入を返します[/冗談]...

score 2 · Accepted Answer

8 パズルの 4x4 ビッグブラザーである15 パズルの解決策に対する私の並列反復深化検索については、このリンクを参照してください。

algorithm - 8パズル問題を解決するための効率的なアプローチは何ですか?

6 に答える 6

後で多くの月を編集する

Related

Reference