同時に行われる決定を最適化して、妥当な時間で迅速な結果を見つけるための最良のアルゴリズムを探しています。同時実行は多くの「ティック」を実行し、場合によっては決定を下す必要があります。最終的には目標状態に到達します。(非常に悪い決定をした場合、目標状態に到達することは決してありません)
多くの目標状態があります。ティック数が最も少ない目標状態を見つけたい(ティックは実際の生活ではおよそ1秒に相当する)。基本的には、できるだけ数秒で目標に到達するためにどの決定を下すかを決定したい。
問題のあるドメインに関するいくつかのポイント:
- すぐに、解決策につながる一連の選択肢を生成できます。最適ではありません。
- 何が適切な決定であるかを判断するための合理的なヒューリスティック関数があります
- ノードからゴールまでの最小の時間コストを決定するための合理的な機能があります。
アルゴリズム:
- この問題を約10秒間処理してから、可能な限り最善の答えを出す必要があります。
- 私はA*が私に最適な解決策を見つけるだろうと信じています。問題は、決定木が非常に大きくなり、十分な速さで計算できないことです。
- IDA *は、10秒で最初のいくつかの良い選択肢を与えてくれますが、ゴールまでの道が必要です。
現時点では、目標への既知の最適ではないパスから始めて、おそらくシミュレートされたアニーリングを使用して、10秒以上かけて改善を試みることを考えています。
この種の問題を解決するために研究するのに良いアルゴリズムは何でしょうか?