4

3D 再構成にグラフ カットを使用することに関するいくつかの論文を読みましたが、この問題を提起するには 2 つの代替アプローチがあるように思われることに気付きました。

1 つのアプローチは容積測定であり、ボクセルの 3D 領域を記述し、グラフ カットを使用して各ボクセルのバイナリ ラベリング (対象オブジェクトを含むか含まないか) を推測します。このアプローチを取る論文には、Volumetric Graph Cuts による Multi-View Stereo と Occlusion Robust Photo-ConsistencyおよびA Surface Reconstruction Using Global Graph Cut Optimizationが含まれます。

2 番目のアプローチは 2D であり、参照イメージの各ピクセルに、そこに投影される 3D ポイントの深さでラベルを付けようとします。このアプローチを取る論文には、Computing Visual Correspondence with Occlusions via Graph Cutsが含まれます。

各方法の長所と短所を理解し、どの方法を使用するかを選択する際にどれが最も重要かを理解したい. これまでのところ、最初のアプローチのいくつかの利点は次のとおりであることを理解しています。

  1. これはバイナリ問題であるため、Max-Flow アルゴリズムで正確に解決できます。
  2. オクルージョンをモデリングする簡単な方法を提供します。

そして、2 番目のアプローチのいくつかの利点は次のとおりです。

  1. グラフの各ノードに設定された、より小さな近傍。
  2. 滑らかさのモデル化が容易になります (しかし、より良い結果が得られますか?)。

さらに、どちらの表現を選択した方がよいか、またその理由についても知りたいと思います。

4

1 に答える 1

6

最も大きな違いは、アルゴリズムが通常使用されるシーンのタイプと、オブジェクトの 3D 形状を表現する方法です。

体積アプローチが最も効果的です...

  1. 大量の画像で...
  2. さまざまな視点から撮影され、オブジェクトの周りにうまく分散されています...
  3. 多かれ少なかれコンパクトな「オブジェクト」(たとえば、車両カメラで観察された屋外シーンとは対照的に、アーティファクトなど)の。

ボリューム アプローチは、「オブジェクト」(特にアーティファクト) の再構築によく使用されます。十分なビュー (つまり画像) が与えられると、アルゴリズムはオブジェクトの形状の完全なボリューム (つまりボクセル) 表現を提供します。これは、マーチング キューブまたは同様の方法を使用してサーフェス表現に変換できます。

あなたが特定した 2 番目のタイプのアルゴリズムはステレオ アルゴリズムと呼ばれ、グラフ カットはそのような問題を解決する多くの方法の 1 つにすぎません。ステレオが一番...

  1. 画像が2枚しかない場合...
  2. ベースラインがかなり狭い (つまり、カメラ間の距離)

2 つ以上の画像 (ベースラインが狭い) への一般化が存在しますが、文献のほとんどは双眼鏡 (つまり 2 つの画像) の場合を扱っています。一部のアルゴリズムは、他のものよりも簡単に多くのビューに一般化できます。

ステレオ アルゴリズムは、深度マップ、つまり各ピクセルの深度値を持つ画像のみを提供します。これにより、オブジェクトの「周り」を見ることができなくなります。ただし、画像ペアのステレオから開始し、深度マップを組み合わせて完全なオブジェクトの表現を取得する 3D 再構成システムがあります。これは、それ自体が重要な問題です。興味深いことに、これは多くの場合、中間ステップとしてボリューム表現を使用してアプローチされます。

ステレオ アルゴリズムは、「シーン」に使用することができ、よく使用されます。たとえば、車内の 2 台のカメラで監視された道路や、3D ビデオ会議用の部屋にいる人々などです。

いくつかの閉会の辞

  • ステレオ再構成とボリューム再構成の両方で、グラフ カットは問題を解決するためのいくつかの方法の 1 つにすぎません。たとえば、ステレオは、離散的な問題ではなく、連続的な最適化問題として定式化することもできます。これは、その解決のための他の最適化方法を意味します。
  • 私の答えには、多くの一般化と単純化が含まれています。これは、対象の決定的な治療を意味するものではありません。

ステレオの場合の方がスムーズであることに必ずしも同意するわけではありません。どうしてそう思うの?

于 2013-03-09T15:36:34.167 に答える