ロボスクールのハーフチーターについて質問です。
Half-Cheetah の観測空間は 26 であることがわかります。各値の意味を誰か教えてもらえますか? - 数えたのは 18 だけです (また、すべてのタイムステップで値の一部が 0 のままであるように見えます)。
roboschool/mujoco_assets の下の half_cheetah.xml には、次のコメントがあります。
チーターモデル
状態空間には、このファイルで定義されている順序でジョイントが取り込まれます。アクチュエータは関節でも動作します。
State-Space (name/joint/parameter):
- rootx slider position (m)
- rootz slider position (m)
- rooty hinge angle (rad)
- bthigh hinge angle (rad)
- bshin hinge angle (rad)
- bfoot hinge angle (rad)
- fthigh hinge angle (rad)
- fshin hinge angle (rad)
- ffoot hinge angle (rad)
- rootx slider velocity (m/s)
- rootz slider velocity (m/s)
- rooty hinge angular velocity (rad/s)
- bthigh hinge angular velocity (rad/s)
- bshin hinge angular velocity (rad/s)
- bfoot hinge angular velocity (rad/s)
- fthigh hinge angular velocity (rad/s)
- fshin hinge angular velocity (rad/s)
- ffoot hinge angular velocity (rad/s)
Actuators (name/actuator/parameter):
- bthigh hinge torque (N m)
- bshin hinge torque (N m)
- bfoot hinge torque (N m)
- fthigh hinge torque (N m)
- fshin hinge torque (N m)
- ffoot hinge torque (N m)
ここに示されている順序が、観測マトリックスに表示される順序と同じかどうか確認していただけますか? もしそうなら、常に 0 である値を考慮に入れる必要がありますか?
ありがとうございました。