強化学習を用いたAIの開発を行っています。
空から落ちてくるレンガを避けるゲームです。
20 個のレンガが地面に落ちています。 ゲームのスクリーンショット、ゲームプレイ動画リンク
線形関数による強化学習を用いて AI を実装しました。
満足のいく結果を得るために最適な機能を選択するのは困難でした。
とにかく、作ってみて以来、最高のスコアを獲得することができました。
しかし、それはかなり奇妙です。
いくつかの理由があります。
- 10 トレーニング前後で非常に早く収束に達しました。
- 6つの機能を使用しました。
- 何度もトレーニングを重ねても良いスコアは出せませんでした。(自分の AI をスーパー プレイヤーのようにプレイさせたかったのですが、そうは見えませんでした。)
その間、私は多くの機能を使用しようとしました。機能をゲーム画面サイズ (960 * 640) として定義しました。
そして、プレイヤーからのブリックの相対座標であるこれらの機能を埋めます。前回よりも良い結果が出せることを願っています。このメソッドを 7 時間トレーニングしましたが、うまくいきませんでした。
肝心なのは、機能を最適に機能させるにはどのように選択すればよいですか、またはそれを解決するための別のアプローチはありますか?