CarRacing-v0 環境でエージェントをトレーニングしたいのですが、ボックス アクション/観察スペースの代わりに、DQN アルゴリズムでトレーニングできるように離散スペースを使用したいと考えています。openai-gym には次のような格言があります。 https://gym.openai.com/envs/CarRacing-v0/
しかし、コードまたは実用的な方法でそれを行う方法がわかりません。
CarRacing-v0 環境でエージェントをトレーニングしたいのですが、ボックス アクション/観察スペースの代わりに、DQN アルゴリズムでトレーニングできるように離散スペースを使用したいと考えています。openai-gym には次のような格言があります。 https://gym.openai.com/envs/CarRacing-v0/
しかし、コードまたは実用的な方法でそれを行う方法がわかりません。