opencv - スキャンした文書からフィールドを抽出するために使用される画像登録アルゴリズム/技術は?

Question

ここに画像の説明を入力スキャンした文書から手書きデータを抽出する最良の方法を決定しようとしています。

手書きデータは、特定のボックス領域にあります。ドキュメントのデジタルバージョンを生成したため、四角で囲まれた領域の両方の座標がわかり、必要に応じてドキュメントの追加のバリエーション (つまり、フィールドを抽出しやすくするためにマスクされたバージョン) を生成することもできます。

ドキュメント生成からの座標を使用してフィールドを抽出できない理由は、スキャンプロセス中に発生するシフト/スケーリング/パースペクティブの変更があり、個々のボックスの座標を異なる方法でプッシュ/プルすることができるためです (スキャンされたドキュメントには位置合わせに使用されるコーナーマーカーがありますが、それでも意図しない変形が一般的に発生します)。

この問題に対処するには、大まかに次の 2 つの方法があると思います。ページ上の各ボックスの座標を調べて、何らかの手法/アルゴリズムでそれらを「修正」しようとするか、完成したフォームを空白のフォーム (マスクされた? ）、そのように正しいフィールドを抽出してみてください。

これらの変更を調整し、手書きを含む領域を正確に抽出するための最も効率的な手法/アルゴリズムは何ですか? 他のオプションはありますか？

score 0 · Accepted Answer

問題に対してほぼ 100% の精度を達成できる手法は多数あります。

このページhttp://www.codeproject.com/Articles/24809/Image-Alignment-Algorithmsに記載されている手順に従ってください。つまり、最初に 2 つの画像間のオプティカルフローを計算し、次にそのようなオプティカルフローを生成する変換を推定します。

注: このアプローチは、一致する画像がほぼ同一である場合に最も効果的です。

opencv - スキャンした文書からフィールドを抽出するために使用される画像登録アルゴリズム/技術は?

2 に答える 2

Related

Reference