2つの画像があるとしましょう。最初の画像は変換が適用されていない画像です:(A1)http://tinypic.com/r/qsunaw/6 2番目の画像はスキュー変換が適用されています:(A2)http:// tinypic .com / r / 90adk0 / 6
最初の画像から2番目の画像(およびその逆)に取得する必要がある必要な四辺形変換を通知するアルゴリズムはありますか?
2つの画像があるとしましょう。最初の画像は変換が適用されていない画像です:(A1)http://tinypic.com/r/qsunaw/6 2番目の画像はスキュー変換が適用されています:(A2)http:// tinypic .com / r / 90adk0 / 6
最初の画像から2番目の画像(およびその逆)に取得する必要がある必要な四辺形変換を通知するアルゴリズムはありますか?
これは、コンピューター ビジョンの古典的な「逆問題」です。アルゴリズムはたくさんありますが、適切なアルゴリズムの選択はアプリケーションに完全に依存します。具体的には、入力画像に適用される制約と期待される結果に依存します。問題の設定が不適切である可能性があります (解決策がない場合、解決策がある場合は不安定である場合、または無限の解決策がある場合があります)。
あなたが与えたテキストの歪んだ画像の簡単な例については、おそらく最初は単純なテンプレート マッチングを試してみます。スケールが変更されておらず、画像のコーナーの 1 つに対して一方向に沿って傾斜が適用されていると仮定すると、不明な値 (その方向の傾斜の量) は 1 つだけであり、その値の上限と下限がある場合があります。事前に知られています。したがって、許可された間隔を量子化してから、徹底的な検索を行うことができます-おそらく複数のパスを使用します(ソリューションの境界を引き締め、そこでより細かい量子化を行い、反復します)。
一般的な (つまり、自然な) 画像、およびより一般的に許可されている変換の場合、事態はすぐに複雑になります。平面変換のみに関心があると仮定すると (そうでない場合、オクルージョンのために解がない可能性が非常に高くなります)、最新の方法では、画像全体で「関心点」を検出して一致させようとし、次にロバスト化された最小値を使用して変換を推定しようとします。正方形。
コンピュータ ビジョンのこの下位分野に興味がある場合は、Hartley と Zisserman のバイブルを参考にしてください。
対応する点が 4 つある場合は、画像間の 2D ホモグラフィを計算できます。このトピックに関する情報は尽きることがありません。たとえば、http ://www.cs.utoronto.ca/~strider/vis-notes/tutHomography04.pdfでは、反転できる変換行列の計算方法の紹介と詳細が提供されています。逆変換。