python-3.x - リアルタイム keras rl DQN 予測

翻译自：https://stackoverflow.com/questions/70519086 2021-12-29T11:57:43.983

85 次

みなさん、こんにちは私はそのチュートリアル https://www.youtube.com/watch?v=hCeJeq8U0lo&list=PLgNJO2hghbmjlE6cuKMws2ejC54BTAaWV&index=2に従って DQNエージェントをトレーニングしましたすべてが機能します

env = gym.make('CartPole-v0')
states = env.observation_space.shape[0]
actions = env.action_space.n

episodes = 10
for episode in range(1, episodes+1):
    state = env.reset()
    done = False
    score = 0 
    
    while not done:
        env.render()
        action = random.choice([0,1])
        n_state, reward, done, info = env.step(action)
        score+=reward
    print('Episode:{} Score:{}'.format(episode, score))

ランダムな選択をするのではなく、DQNを使用せずに使用したい

dqn.test(env, steps=10)

dqn.predict のようなものですが、彼らのドキュメントであなたが助けてくれることがわかりませんでした

python-3.x - リアルタイム keras rl DQN 予測

1 に答える 1

Related

Reference