7

ここに画像の説明を入力 スキャンした文書から手書きデータを抽出する最良の方法を決定しようとしています。

手書きデータは、特定のボックス領域にあります。ドキュメントのデジタル バージョンを生成したため、四角で囲まれた領域の両方の座標がわかり、必要に応じてドキュメントの追加のバリエーション (つまり、フィールドを抽出しやすくするためにマスクされたバージョン) を生成することもできます。

ドキュメント生成からの座標を使用してフィールドを抽出できない理由は、スキャン プロセス中に発生するシフト/スケーリング/パースペクティブの変更があり、個々のボックスの座標を異なる方法でプッシュ/プルすることができるためです (スキャンされたドキュメントには位置合わせに使用されるコーナー マーカーがありますが、それでも意図しない変形が一般的に発生します)。

この問題に対処するには、大まかに次の 2 つの方法があると思います。ページ上の各ボックスの座標を調べて、何らかの手法/アルゴリズムでそれらを「修正」しようとするか、完成したフォームを空白のフォーム (マスクされた? )、そのように正しいフィールドを抽出してみてください。

これらの変更を調整し、手書きを含む領域を正確に抽出するための最も効率的な手法/アルゴリズムは何ですか? 他のオプションはありますか?

4

2 に答える 2

0

問題に対してほぼ 100% の精度を達成できる手法は多数あります。

このページhttp://www.codeproject.com/Articles/24809/Image-Alignment-Algorithmsに記載されている手順に従ってください。つまり、最初に 2 つの画像間のオプティカル フローを計算し、次にそのようなオプティカル フローを生成する変換を推定します。

注: このアプローチは、一致する画像がほぼ同一である場合に最も効果的です。

于 2015-04-02T01:43:48.870 に答える