問題タブ [planning]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
80 参照

search - ヒューリスティックを使用して、モンテカルロ検索ツリーのプレイアウト フェーズで結果を取得できますか?

私の理解では、MCTS のプレイアウトまたはシミュレーション段階の目標は、結果を取得し、バックプロパゲーション中にルートからパス上のノードを授与または処罰することです。(間違っていたら訂正してください)

私の質問は、実際にゲームを最後までシミュレートするのではなく、ドメイン知識ヒューリスティックを使用してこの結果を取得できるかどうかです。

私が質問している理由は、パスファインディングに似たようなことをしていて、目標はゴール状態 (ノード) へのパスを見つけることです。つまり、私の場合、ゲームを最後までシミュレートすることは非常に困難です。

0 投票する
0 に答える
1180 参照

python - matplotlib で潜在的なフィールド ナビゲーションを実装しようとしています

複数のエージェント (青) がチームとして協力して、2D グリッドで周囲と旋回の戦術を実行することで、少し速い敵エージェント (赤) をキャプチャするアルゴリズムを作成しようとしています。だから私は、マルチエージェントがインテリジェントでより高速な敵エージェントをキャプチャできるようにする堅牢なマルチエージェントアルゴリズムを作成しようとしています

そこで、潜在的なフィールド ナビゲーションと呼ばれるものを使用して、敵エージェントにナビゲーションと障害物回避能力を与えようとしました。基本的に、エネミーエージェントは出口に引力があり、青の各エージェントが斥力を持っているふりをします。

ポテンシャルフィールドの詳細はこちら

これを敵エージェントに実装したところ、出口に引き寄せられたエージェントは成功しました (出口に近づくと減速するという事実を除いて)。私が抱えている主な問題は、敵が青い粒子を避けようとしている反発フィールドにあります。逃げようとしている間、ジグザグに素早く移動したり、青い粒子またはグループまたは円状の粒子の周りを走り回ったりします。

エネミーエージェントには、青の粒子を賢くうまく避けてもらいたいです。

また、誰かが斥力場を接線場に変える方法を知っているなら、それは素晴らしいことです。赤い粒子が青い粒子をすり抜けることができるように、接線フィールドが必要です。

また、コードは長いですが、敵のエージェントが使用する唯一の関数は goToExit() であるため、その関数とそれが呼び出す関数だけが関連するものになります。

私のコード:

0 投票する
0 に答える
1069 参照

ff - メトリック FF で最小化されないメトリック (総コスト)

Metric-FF (v2.1) を使用して、古典的な計画の問題を解決しようとしています。自分の計画が最適ではないことに気付き、コストの最小化をいじり始めました。コスト最小化が有効になっているにもかかわらず、プランナーがコストを考慮していないように見えることに気付きました。次の最小限の例を作成しました。1 つの述語と 2 つの同一のメソッド (コストを除く) を使用します。

そして、私が解決したいのは次のとおりです。

その結果、do1の方が安価な操作であるにもかかわらず、 do2が呼び出されます。ドメイン ファイル内の位置を変更すると、do1 が選択されます。

これを正しく解決する入手可能なプランナーを知っている場合は、喜んで使用します。

0 投票する
1 に答える
289 参照

artificial-intelligence - PDDL 実装から複数の計画を取得することは可能ですか?

たとえばグラフプランを使用して、PDDL で迷路を解くことができるプログラムを作成しようとしています。私がインターネットで見た例から、問題の解決策が得られますが (例: PDDL Graphplan can't find plan )、1 つだけです。私のプロジェクトにはいくつかの特定の制限があり、迷路を解決するために可能なすべてのソリューションを取得してから、これらのソリューションを個別に評価する必要があります。これは可能ですか?

0 投票する
0 に答える
108 参照

java - Java コレクションにさまざまなオブジェクトを格納するためのマーカー インターフェイス

私は Java で目標のスタックを持つ Linear Planner を実装しています。そのため、述語、演算子、状態などのさまざまなオブジェクトを格納する必要があるStackを使用しています。これを実現するために、Stackable というインターフェイスを作成したので、Stack<Stackable>. すべてのスタック可能オブジェクトに共通するものは何もないため、このインターフェイスは空です。ただし、すべてをスタックする必要があります。

空のインターフェイスのアイデアが気に入らなかったので、読み始めて、Marker インターフェイスという用語に出くわしました。これは私の Stackable の場合だと思います。また、一般的に注釈に置き換えることができることもわかりましたが、使用したことがなく、問題を解決できるかどうかもわかりません。

それが私が知りたい理由です:

  1. 私の設計に代わるより良い方法はありますか (注釈を使用するか、別の方法で)?
  2. 場合によってはマーカー インターフェイスがまだ解決策である場合、いつ使用する必要があるかをどのように区別できますか?
0 投票する
3 に答える
796 参照

artificial-intelligence - ルール エンジンを使用した計画

ルール エンジンを使用してジョブ スケジューリングの問題 ( JSS ) を解決できますか?

こんなものが欲しい。これはルールエンジンで可能ですか、それとも良い考えではありませんか。

0 投票する
1 に答える
349 参照

artificial-intelligence - 線形計画法を使用して m 台のマシンで n 個のジョブを計画する

線形計画法を計画問題に使用できると聞きました。線形計画法が最適であり、大規模な計画 (たとえば、m 台のマシンで n 個のジョブを計画する) は指数関数的に困難であるため、その方法がよくわかりません。

たとえば、線形計画法を使用して 100 個のジョブと 10 個のマシンの問題を解決するにはどうすればよいでしょうか? 説明またはさらに読み物を教えてもらえますか?

0 投票する
1 に答える
167 参照

solution - 計画ソリューションを介して変数を渡す Optaplanner

プランニング エンティティ Request とタクシーとしてのプランニング変数があります。

タクシーの割り当てのために、Date(特定の日)をdroolsファイルに渡したいです。

計画ソリューションに日付を追加しようとしましたが、日付をキャプチャした場所でルールが常に失敗しました。

計画ソリューション

Drools ファイル

ルール「シフト1のオーバーラップをチェック」

0 投票する
1 に答える
199 参照

java - Choco で検索中に制約を作成/投稿および削除/投稿解除する方法

Choco ソルバーでプロジェクトを作成しましたが、検索中の外部効果について質問があります。

レイヤーで編成された (たとえば) BoolVars とレイヤーに割り当てられた期間を含む計画グラフを取得しました。これは、いくつかのアクションが開始され、いくつかが終了することを意味します。変数の選択は、プランの最後からプランの開始まで静的です (レイヤー内のアクションの選択は任意です)。

アクションAの開始と終了の間にNに等しい期間が必要であるため、シンプレックスアルゴリズムを使用して期間を割り当てるソリューションを研究しています。間にはさらにいくつかの制約があります。

追加の制約は、BoolVars のインスタンス化に基づいて作成されますが、それらは外部マトリックスで編成されているため、アクションAの終了アクションが追加されると、結果として追加の行がマトリックスに追加され、現在の制約が再定式化されます。 . バックトラックでは、行列を逆の方法で変更したいと考えています。つまり、行を削除して制約をアンポストします。

Choco でこの複雑な動作を実現する方法はありますか?

0 投票する
1 に答える
253 参照

heuristics - フォワード プランニング ヒューリスティック - hmax と hadd を計算する方法は?

フォワード プランニング ヒューリスティック hmax と hadd の概念を理解しようとしています。オンラインでいくつかのリソースを見つけましたが、hmax と hadd の値を計算する方法が本当にわかりませんか?

ここで私が参照しているリソースは次のとおりです。

http://ai.cs.unibas.ch/_files/teaching/fs16/ai/slides/ai36-handout4.pdf

hmax ではコストの最大化を考慮し、had ではコストの合計を行うことを理解しています。

hmax と hadd のヒューリスティック値

これらの (画像の丸で囲まれた) 値はどのように計算されますか? 初期状態が {a} であるため、初期状態のヒューリスティック値は 0 であると想定しています。これでよろしいですか?

一般に、初期状態の発見的価値はどのくらいですか?

助けてくれてどうもありがとう:)