42

カメラで写真を撮る場合、家の縮尺模型など、カメラから物体までの距離がわかるので、これを3Dモデルにして、操作できるようにしてコメントできるようにしたいと思います。家のさまざまな部分。

座って、複数の写真、ラベルの方向、距離を撮ることを考えれば、その方法を理解できるはずですが、誰かがもっと説明するのに役立つ紙を持っているかどうか尋ねたいと思いました。

私は最善のアプローチを探しているので、どの言語で説明するかは重要ではありません。

現在、家を表示することを検討しています。ユーザーは、カメラからモデルのその部分の上部までの距離など、高さの補助を行うことができます。これが十分にあれば、次の高さの計算を開始できます。残りは、特にトップダウンの画像がある場合は、相対的な高さを計算するために、4つの側面の角度からの画像です。

次に、モデルのさまざまなパーツを区別するために、パーツの色を変える必要があります。

4

6 に答える 6

81

前述のように、この問題は非常に難しく、多視点オブジェクト再構成とも呼ばれます。これは通常、連続する画像の各ペアのステレオ ビュー再構成問題を解くことによってアプローチされます。

ステレオ再構成を実行するには、物理​​的な点がかなり重なって見える画像のペアを取得する必要があります。三角測量を使用してポイントの 3D 座標を見つけることができるように、対応するポイントを見つける必要があります。

エピポーラ幾何

ステレオ再構成は、通常、最初にカメラのセットアップを調整することによって行われます。これにより、エピポーラ幾何学の理論を使用して画像を修正できます。これにより、対応するポイントの検索と最終的な三角測量の計算が簡素化されます。

あなたが持っている場合:

行列理論のみを使用して基本行列と必須行列を計算し、これらを使用して画像を修正できます。これには、同次座標による座標射影に関する理論と、ピンホール カメラ モデルカメラ マトリックスの知識が必要です。

カメラのパラメーターを必要とせず、未知のカメラ設定で機能する方法が必要な場合は、おそらく、キャリブレーションされていないステレオ再構成の方法を検討する必要があります。

対応問題

対応する点を見つけることは、同じ明るさまたは色の点を探すか、テクスチャ パターンまたはその他の機能を使用して画像のペアで同じ点を識別する必要がある難しい部分です。このための手法は、各ポイントの周囲の小さな領域で最適な一致を探すことによって局所的に機能するか、画像全体を考慮してグローバルに機能します。

基本行列が既にある場合は、2 つの画像の対応する点が (理論的には) 線に拘束されるように画像を修正できます。これにより、より高速なローカル テクニックを使用できます。

現在、通信問題を解決するための理想的な手法はまだありませんが、可能なアプローチは次のカテゴリに分類される可能性があります。

  • 手動選択: マッチング ポイントを手動で選択します。
  • カスタム マーカー: マーカーを配置するか、簡単に識別できる特定のパターン/色を使用します。
  • 差の二乗和: ポイントの周囲の領域を取得し、他の画像で最も近い一致する領域全体を見つけます。
  • グラフ カット: グラフ理論を使用した最適化に基づくグローバルな最適化手法。

特定の実装については、Google Scholarを使用して最新の文献を検索できます。これは、さまざまな手法を比較した非常に引用された論文の 1 つです: A Taxonomy and Evaluation of Dense Two-Frame Stereo Correspondence Algorithms

マルチビュー再構成

対応する点を取得したら、三角形分割の計算にエピポーラ幾何学理論を使用して、点の 3D 座標を見つけることができます。

このステレオ再構成全体が、連続する画像の各ペアに対して繰り返されます (つまり、画像の順序、または少なくともどの画像に多くの重複点があるかを知る必要があることを意味します)。ペアごとに、異なる基礎行列を計算します。

もちろん、これらの各ステップでノイズや不正確さがあるため、よりグローバルな方法で問題を解決する方法を検討する必要がある場合があります。たとえば、オブジェクトの周りで取得され、ループを形成する一連の画像がある場合、バンドル調整などを使用して前のステップの精度を向上させるために使用できる追加の制約が提供されます。

ご覧のとおり、ステレオ再構成とマルチビュー再構成はどちらも解決された問題にはほど遠いものであり、現在も活発に研究されています。自動化された方法で行う必要が少ないほど、問題はより明確に定義されますが、これらの場合でも、開始するにはかなりの理論が必要です。

代替案

やりたいことの制約内であれば、通常のカメラだけを使用するのではなく、専用のハードウェア センサー ( XBox の Kinectなど) を検討することをお勧めします。これらのセンサーは、構造化された光、飛行時間、またはその他の距離画像技術を使用して深度画像を生成し、それを独自のカメラからのカラー データと組み合わせることもできます。単一ビューの再構成の問題を実際に解決し、多くの場合、複数のビューをステッチ/結合するためのライブラリとツールが含まれています。

エピポーラ ジオメトリのリファレンス

私の知識はほとんどの理論について実際には非常に薄いので、私ができる最善のことは、役立つと思われる参考文献をさらに提供することです(関連性の高い順に):

これらすべてがどれほど役立つかはわかりませんが、役立つ用語や参考文献が十分に含まれていることを願っています。

于 2012-06-03T13:13:36.417 に答える
14

この問題は、フォトグラメトリとして知られています。

Google は無限のリファレンスを提供してくれますが、自分で作成したい場合は非常に難しい問題であることに注意してください。

于 2012-05-29T15:18:59.663 に答える
4

The Deadalus Projectをチェックしてください。その Web サイトには、ソリューションに関する例示的な情報を含むギャラリーは含まれていませんが、いくつかの論文と作業方法に関する情報が掲載されています。

プロジェクトの主な研究者の 1 人 (Roger Hubbold) の講義を見ましたが、画像の結果は非常に驚くべきものでした。思考は複雑で長い問題です。3D データの近似値を取得するために考慮しなければならない多くのトリッキーな詳細があります。たとえば、壁面から 3D 情報を取得します。ヒューリスティックは次のように機能します。シーンの通常の照明で写真を撮ります。次に、フル フラッシュをアクティブにして同じ位置で写真を再撮影します。次に、両方の画像を減算し、結果を事前に撮影したフラッシュ キャリブレーション画像で割ります。この新しい結果にボックス フィルターを適用し、後処理して深度値を推定します。プロセスはこのペーパーで詳細に説明されています(プロジェクトの Web サイトにも掲載/参照されています)。

于 2012-06-04T00:41:13.310 に答える
3

Google Sketchup (無料) には、写真を撮ってその遠近法を合わせて簡単にモデリングできる写真マッチング ツールがあります。

編集: 独自のソリューションの開発に興味があるようです。単一のインスタンスで画像の 3D モデルを取得しようとしていると思いました。この回答が役に立たない場合は、お詫び申し上げます。

于 2011-11-21T22:09:58.740 に答える