前述のように、この問題は非常に難しく、多視点オブジェクト再構成とも呼ばれます。これは通常、連続する画像の各ペアのステレオ ビュー再構成問題を解くことによってアプローチされます。
ステレオ再構成を実行するには、物理的な点がかなり重なって見える画像のペアを取得する必要があります。三角測量を使用してポイントの 3D 座標を見つけることができるように、対応するポイントを見つける必要があります。
エピポーラ幾何
ステレオ再構成は、通常、最初にカメラのセットアップを調整することによって行われます。これにより、エピポーラ幾何学の理論を使用して画像を修正できます。これにより、対応するポイントの検索と最終的な三角測量の計算が簡素化されます。
あなたが持っている場合:
行列理論のみを使用して基本行列と必須行列を計算し、これらを使用して画像を修正できます。これには、同次座標による座標射影に関する理論と、ピンホール カメラ モデルとカメラ マトリックスの知識が必要です。
カメラのパラメーターを必要とせず、未知のカメラ設定で機能する方法が必要な場合は、おそらく、キャリブレーションされていないステレオ再構成の方法を検討する必要があります。
対応問題
対応する点を見つけることは、同じ明るさまたは色の点を探すか、テクスチャ パターンまたはその他の機能を使用して画像のペアで同じ点を識別する必要がある難しい部分です。このための手法は、各ポイントの周囲の小さな領域で最適な一致を探すことによって局所的に機能するか、画像全体を考慮してグローバルに機能します。
基本行列が既にある場合は、2 つの画像の対応する点が (理論的には) 線に拘束されるように画像を修正できます。これにより、より高速なローカル テクニックを使用できます。
現在、通信問題を解決するための理想的な手法はまだありませんが、可能なアプローチは次のカテゴリに分類される可能性があります。
- 手動選択: マッチング ポイントを手動で選択します。
- カスタム マーカー: マーカーを配置するか、簡単に識別できる特定のパターン/色を使用します。
- 差の二乗和: ポイントの周囲の領域を取得し、他の画像で最も近い一致する領域全体を見つけます。
- グラフ カット: グラフ理論を使用した最適化に基づくグローバルな最適化手法。
特定の実装については、Google Scholarを使用して最新の文献を検索できます。これは、さまざまな手法を比較した非常に引用された論文の 1 つです:
A Taxonomy and Evaluation of Dense Two-Frame Stereo Correspondence Algorithms。
マルチビュー再構成
対応する点を取得したら、三角形分割の計算にエピポーラ幾何学理論を使用して、点の 3D 座標を見つけることができます。
このステレオ再構成全体が、連続する画像の各ペアに対して繰り返されます (つまり、画像の順序、または少なくともどの画像に多くの重複点があるかを知る必要があることを意味します)。ペアごとに、異なる基礎行列を計算します。
もちろん、これらの各ステップでノイズや不正確さがあるため、よりグローバルな方法で問題を解決する方法を検討する必要がある場合があります。たとえば、オブジェクトの周りで取得され、ループを形成する一連の画像がある場合、バンドル調整などを使用して前のステップの精度を向上させるために使用できる追加の制約が提供されます。
ご覧のとおり、ステレオ再構成とマルチビュー再構成はどちらも解決された問題にはほど遠いものであり、現在も活発に研究されています。自動化された方法で行う必要が少ないほど、問題はより明確に定義されますが、これらの場合でも、開始するにはかなりの理論が必要です。
代替案
やりたいことの制約内であれば、通常のカメラだけを使用するのではなく、専用のハードウェア センサー ( XBox の Kinectなど) を検討することをお勧めします。これらのセンサーは、構造化された光、飛行時間、またはその他の距離画像技術を使用して深度画像を生成し、それを独自のカメラからのカラー データと組み合わせることもできます。単一ビューの再構成の問題を実際に解決し、多くの場合、複数のビューをステッチ/結合するためのライブラリとツールが含まれています。
エピポーラ ジオメトリのリファレンス
私の知識はほとんどの理論について実際には非常に薄いので、私ができる最善のことは、役立つと思われる参考文献をさらに提供することです(関連性の高い順に):
これらすべてがどれほど役立つかはわかりませんが、役立つ用語や参考文献が十分に含まれていることを願っています。