0

画像の大規模なデータセットがあります。これらの画像には建物が含まれています。これらの画像からデータを抽出するインテリジェントな方法を探しています。

入力

  • 大まかな座標を持つ建物の画像のコレクション

方法

  • プログラムは、建物の顔の画像を抽出できる必要があります。
  • 「正面向き」になるように画像を修正します(一部の画像は建物の顔に対して斜めに撮影されています)
  • 建物の面の詳細要素(窓、ドアなど)にタグを割り当て、これらの要素に建物の面内の座標を指定します。
  • 建物のテクスチャにタグを割り当てます(つまり、レンガ、コンクリート、その他1、その他2)
  • 類似の建物の画像をグループ化します(サイズと形状を使用)
  • 類似の詳細要素とテクスチャ要素を画像のサブディレクトリにグループ化します。
  • 各建物の画像に(ソースで提供される)座標を割り当てます

出力

  • すべての建物の顔の画像のクリーンなデータベース。関連する座標、テクスチャ、画像座標を持つ詳細要素が含まれ、JavascriptまたはPHPを介して簡単にインデックスを作成できます。

ヘルプ

  • このプロジェクトに関するあらゆるアドバイスに感謝します。便利なコードスニペット/ライブラリ/プロジェクトへのリンク。
4

1 に答える 1

0

プログラムよりも Mechanical Turk を使用してこれを行う可能性が高いと思います

https://www.mturk.com/mturk/welcome

もしそうなら、あなたの仕事は、変換と抽出を行うために必要な情報を提供するために、非常に使いやすい GUI を作成することです。

  1. 正面の角である4点を集める
  2. 画像からその四角形を抽出します
  3. 四角形のワープを使用して、それを長方形に変えます
  4. ユーザーにこの画像を表示する
  5. パーツにタグを付ける
  6. 彼らにメタデータを入力させます(具体的なものなど)
  7. 別の人に QA タスクを割り当てて、それをチェックするだけにする (または、同じタスクを別の人に与え、同意しない場合は QA を行う)
于 2012-04-13T14:40:49.097 に答える