スキャンした文書から手書きデータを抽出する最良の方法を決定しようとしています。
手書きデータは、特定のボックス領域にあります。ドキュメントのデジタル バージョンを生成したため、四角で囲まれた領域の両方の座標がわかり、必要に応じてドキュメントの追加のバリエーション (つまり、フィールドを抽出しやすくするためにマスクされたバージョン) を生成することもできます。
ドキュメント生成からの座標を使用してフィールドを抽出できない理由は、スキャン プロセス中に発生するシフト/スケーリング/パースペクティブの変更があり、個々のボックスの座標を異なる方法でプッシュ/プルすることができるためです (スキャンされたドキュメントには位置合わせに使用されるコーナー マーカーがありますが、それでも意図しない変形が一般的に発生します)。
この問題に対処するには、大まかに次の 2 つの方法があると思います。ページ上の各ボックスの座標を調べて、何らかの手法/アルゴリズムでそれらを「修正」しようとするか、完成したフォームを空白のフォーム (マスクされた? )、そのように正しいフィールドを抽出してみてください。
これらの変更を調整し、手書きを含む領域を正確に抽出するための最も効率的な手法/アルゴリズムは何ですか? 他のオプションはありますか?