machine-learning - ニューラルネットワークを使用してオンラインで Q-Table を推定する

翻译自：https://stackoverflow.com/questions/19635138 2013-10-28T12:44:17.763

136 次

0

強化学習で状態アクションを保存するために Q-Table を使用すると、一部の状態がまったく (またはめったに) 発生せず、状態アクションの値が最大反復までゼロのままになるため、使用する代わりにニューラルネットワークを使用して Q-Table をオンラインで推定することにします。 Q テーブル。

この種の問題をより正確に推定できるのはどのタイプのニューラルネットワークですか?また、この解決策は役に立ちますか?

1 に答える 1

0

関数の近似として Localy Weighted Regression(LWR) を使用し、テーブルをこの関数に置き換えるだけです

于 2014-01-30T18:43:14.770 に答える