私は強化学習の完全な初心者であり、この危険な地形を簡単にナビゲートするためのフレームワーク/モジュールを探していました。私の検索では、2 つのモジュール keras-rl と OpenAI GYM に出会いました。
WIKI で共有している例で 2 つの作業を行うことができますが、事前定義された環境が付属しており、独自のカスタム環境をセットアップする方法に関する情報がほとんどまたはまったくありません。
誰かが私にチュートリアルを教えてくれたり、ゲーム以外の環境をセットアップする方法を説明してくれたりしたら本当にありがたいです?