machine-learning - 線形関数近似を使用した q 学習の機能を選択するにはどうすればよいですか

Question

強化学習を用いたAIの開発を行っています。

空から落ちてくるレンガを避けるゲームです。

線形関数による強化学習を用いて AI を実装しました。

満足のいく結果を得るために最適な機能を選択するのは困難でした。

とにかく、作ってみて以来、最高のスコアを獲得することができました。

しかし、それはかなり奇妙です。

いくつかの理由があります。

その間、私は多くの機能を使用しようとしました。機能をゲーム画面サイズ (960 * 640) として定義しました。

そして、プレイヤーからのブリックの相対座標であるこれらの機能を埋めます。前回よりも良い結果が出せることを願っています。このメソッドを 7 時間トレーニングしましたが、うまくいきませんでした。

肝心なのは、機能を最適に機能させるにはどのように選択すればよいですか、またはそれを解決するための別のアプローチはありますか?

0 に答える 0