各画像にカメラポーズ(またはオブジェクトポーズ)の注釈が付けられた、さまざまなポーズのオブジェクトの画像のデータセットを作成しようとしています。
たとえば、ワールド座標系があり、対象のオブジェクトを原点に配置し、カメラを既知の位置 (x、y、z) に配置して原点に向けるとします。この情報があれば、カメラまたはオブジェクトのポーズ (回転行列) をどのように計算できますか。
オブジェクトの回転を定義できる参照座標、つまり (0,0,z') を持つという 1 つのアイデアがありました。つまり、チルト、ピッチ、ヨーです。次に、(0,0,z') と (x,y,z) から回転を計算して、回転行列を得ることができます。問題は、2 つの回転行列をどのように結合するかということです。
ところで、物理的にカメラを動かすのではなく、CAD モデルから OpenGL でこれらをレンダリングしているので、カメラのワールド位置を知っています。