3D 再構成にグラフ カットを使用することに関するいくつかの論文を読みましたが、この問題を提起するには 2 つの代替アプローチがあるように思われることに気付きました。
1 つのアプローチは容積測定であり、ボクセルの 3D 領域を記述し、グラフ カットを使用して各ボクセルのバイナリ ラベリング (対象オブジェクトを含むか含まないか) を推測します。このアプローチを取る論文には、Volumetric Graph Cuts による Multi-View Stereo と Occlusion Robust Photo-ConsistencyおよびA Surface Reconstruction Using Global Graph Cut Optimizationが含まれます。
2 番目のアプローチは 2D であり、参照イメージの各ピクセルに、そこに投影される 3D ポイントの深さでラベルを付けようとします。このアプローチを取る論文には、Computing Visual Correspondence with Occlusions via Graph Cutsが含まれます。
各方法の長所と短所を理解し、どの方法を使用するかを選択する際にどれが最も重要かを理解したい. これまでのところ、最初のアプローチのいくつかの利点は次のとおりであることを理解しています。
- これはバイナリ問題であるため、Max-Flow アルゴリズムで正確に解決できます。
- オクルージョンをモデリングする簡単な方法を提供します。
そして、2 番目のアプローチのいくつかの利点は次のとおりです。
- グラフの各ノードに設定された、より小さな近傍。
- 滑らかさのモデル化が容易になります (しかし、より良い結果が得られますか?)。
さらに、どちらの表現を選択した方がよいか、またその理由についても知りたいと思います。