3

これはピンホール カメラ モデル:

ここに画像の説明を入力

(わかりません、[R t] または (R, t) はありますか) この式は、点の 3 次元座標を、ピンホール カメラで取得した画像の 2 次元座標に変換しています。

投影図:

ここに画像の説明を入力

ベクトル上のチルダは、要素としてそのベクトルに「1」が追加されることを意味します。M は 3 次元空間内の点の座標、m は画像内の点の座標、f はカメラの焦点距離、s はピクセル アスペクト比です。(R, t) は、四角形が記述されるワールド座標系とカメラ座標系の間の 3D 変換を記述します。

A の後の [R t] (または (R, t)) の意味と、角の 3D 座標 (ピクセル アスペクト比 = 1) を式に挿入することで、次のようになることは、私にはわかりません。

ここに画像の説明を入力

そして、「t」文字はどういう意味ですか?

この式はここにあります(13ページ)。

4

1 に答える 1

4

A[R t] はカメラ画像から私たちの世界に画像をもたらす全体の変換です。[R t] は行列 A を掛けた行列です。R は回転行列で、t はどちらもカメラを記述するために必要です。A は、焦点距離、ピクセル比、および中心点に関して写真カメラを記述する行列です。システムは [R t] を解こうとしています。

この式は、画像内のホワイトボードの 4 つの点 (m で指定) が平面上にあることを前提としています。したがって、それらの座標は、すべての m に対して z=0、m(1) となるような投影空間内に存在します。 y = m(2).y、m(3).y = m(4).y および m(1).x = m(3).x および m(2).x = m(4).x . 焦点距離、ピクセル サイズ、および m への変換によって定義される物理的なカメラの歪みを適用して画像を修正し、A(m チルダ) が最終的に M チルダになるような変換を決定します。その変換は行列によって与えられます。 [RT]。記事を最後までたどると、カメラ[R t]の計算式が示されます(ポイントまで)。ただし、m に基づいて M の幅と高さを決定することはできず、縦横比だけを決定することはできません。

于 2012-01-04T15:43:42.207 に答える