アプリケーションで、モノクロ イメージ ファイルとして存在するフォームの 1 つのフィールドに入力する必要があります。フォームは常に同じ紙のバージョンとして開始されますが、アプリケーションがユーザーからフォームを取得するまでに、複数回スキャンまたはファックス送信されている可能性があります。そのため、必要なフィールドがすべてのファイルで同じ場所にあるわけではありません。
ユーザーが常に空白のフォームを受け取るとは限らないため、後で認識できるマークやプレースホルダーを印刷する機能がありません。
元の空白のフォームにテキストがありますが、FAX 送信された可能性があるため、解像度は 200 dpi しかありません。テキストは常に人間が読むのに十分な大きさですが、OCR については懐疑的です。
予算はいくらかあるので、無料のソリューションは必要ありません... $2000 としましょう。
とは言え、検討中です
必要なフィールドのテキスト ラベルを見つけるための OCR ソリューションを入手してください。私は自分自身をロールバックするためのリソースや専門知識を持っているとは思いません. テキストの内容はすでに知っているので、完全な認識は必要ありません。ただし、X 座標と Y 座標を知る必要があります。これを行うソフトウェアはありますか?それとも、プログラミングは思ったより簡単ですか?
フォームのエッジを認識するソフトウェアを作成または購入します。そこから、必要なフィールドの相対位置を取得できました。スキャナー ソフトウェアが小さな文書の画像の周りに配置する破線について考えています。それは既知のアルゴリズムですか、それとも利用可能な解決策はありますか?
必要なフィールドを認識する他の方法。フォーム入力ソフトウェアをグーグルで検索しようとすると、何百もの Web フォーム、PDF フォームなどの一致が得られます。
私は言葉にうるさいわけではありません。私のアプリケーションは Linux で実行されますが、最適なソリューションが Microsoft である場合、おそらくそれを機能させることができます。
よろしくお願いします。