ocr - スキャンしたドキュメント/画像からIDフィールドを確実に抽出しますか？

Question

スキャン後に自動的にルーティングできるように、紙のフォームから2つの事前に印刷された（手書きではない）フィールドを引き出す必要があります。フィールドには、「GG-9192」や「EPN/245G」などのバッチおよびアイテム識別子が含まれます。

私は次のソフトウェアを試しました：

Tesseract-OCR
楔形文字
CanonImageRunner組み込みOCR
Asprise OCR Java API（デモ）

次の設定を試しました。

300dpiおよび600dpiの解像度でスキャン
OCR-AやOCR-Bなどのさまざまなフォントを試しました。

すべての場合において、出力はほとんどいたるところにありました。必要な情報を適切に抽出できないドキュメントをキックバックすることはできますが、少なくとも半分になると思います。データベース内の既知の値に基づいて、ある種のファジーロジックを検討しましたが、これらの識別子は、「123G」や「123C」のように1文字だけ異なる場合があります。

これは失われた原因ですか？ おそらく、OCRは、この性質の要件を処理するのに十分成熟していないのでしょうか。他にどのようなテクニックをお勧めしますか？バーコード？

編集：含まれているアプリケーションはJavaであるため、無料または安価なJavaベースのAPIがある推奨事項が役立ちます。

編集2：誰かが興味を持っている場合...特別な調整なしで、Linux用の楔形文字とCanon ImageRunnerが最もよく機能し、Tesserect-OCRとAspriseJavaAPIが最悪の結果をもたらしました...4つのうちどれも標準以外には受け入れられませんでしたドキュメント検索グレードのOCR。これはうまくいかないと思い始めています。

score 2 · Accepted Answer

トマトさんの提案をきっかけに商品を探し始めました。ABBYYとCVISIONを試してみました。両方とも、OCR を自動化できる製品があります。

さらに、ABBYY にはさまざまなプラットフォーム用の SDKがあり、CVISION には、少なくとも VB/VC++ で動作するように見えるSDKがあります。

どちらの SDK もまだ試していません。プロジェクトに必要かどうかもわかりません。必要なのは、テキストを抽出できる PDF が入ってくることだけです。しかし、CVISION のサーバー製品を試してみたところ、OCR を最も正確な設定で使用したところ、非常にうまく機能しました。ABBYY のサーバー製品はまだ試用していません。試用版を取得するには再販業者を経由する必要があるからです。私はそうしている途中ですが、それが面倒になり始めたら、おそらくCVISIONを使用するつもりです. 私は ABBYY の FineReader スタンドアロン製品を試してみましたが、非常にうまく機能したので、ABBYY のサーバー製品も同様であると思います。

score 2 · Accepted Answer

フィールドを制御できるのであれば、そもそも人間が読める形式を使用する必要はありません。スキャンする場合はQRコードか、それに近いものが良いと思います。方向がマークされており、エラー修正機能が組み込まれています。

http://en.wikipedia.org/wiki/QR_Code

ocr - スキャンしたドキュメント/画像からIDフィールドを確実に抽出しますか？

2 に答える 2

Related

Reference