0

CarRacing-v0 環境でエージェントをトレーニングしたいのですが、ボックス アクション/観察スペースの代わりに、DQN アルゴリズムでトレーニングできるように離散スペースを使用したいと考えています。openai-gym には次のような格言があります。 https://gym.openai.com/envs/CarRacing-v0/

しかし、コードまたは実用的な方法でそれを行う方法がわかりません。

4

0 に答える 0