私は RL を初めて使用しますが、これまでに行った中で最も優れているのは、openAI ジムの CartPole です。cartPole では、実行されたアクションに応じて API が自動的に報酬を提供します。私が持っているのはピクセルデータだけで、特定のアクションの報酬を伝えることができる「魔法の関数」がない場合、どのように報酬を決定することになっていますか。
たとえば、GTA San Andreas で自動運転ボットを作りたいとします。私がアクセスできる入力は生のピクセルです。特定のアクションに対する報酬をどのように計算すればよいですか?