現在、OCR に提出する前に画質を向上させる方法を研究しています。現在使用している OCR エンジンは、Nuance の Scansoft API (v15) です。私たちはLead Toolsを調査していましたが、それ以来他の場所を探すことにしました。Lead Tools に関連するライセンス費用は高すぎます。まず、傾き補正、斑点除去、ライン除去、パンチホール除去、シャープニングなどの単純な画像処理機能を探しています。.NET と Java ソフトウェアを組み合わせて実行していますが、Java ソリューションが望ましいです。
7 に答える
Kofax は前処理には適していますが、画像が本当に悪い場合を除き、あなたが話しているクリーンアップの種類についてはやり過ぎかもしれません。あなたの専門が画像処理でない限り、実際に付加する価値に集中できるように、画像のクリーンアップと OCR を行うプロバイダーと協力することをお勧めします。
私たちは ABBYY の OCR 開発キット ( ABBY SDK ) のライセンスを取得しており、画像処理と OCR の両方に優れていることがわかりました。API は非常に広範で、サンプル アプリ、ヘルプ、サポートは非常に優れています。絶対に見てみることをお勧めします。
免責事項: 私はアタラソフトで働いています
これらの機能とランタイム ロイヤリティ フリーの .NET ライセンスが用意されています。
http://www.atalasoft.com/products/dotimage/
また、Abbyy、Tesseract などの .NET ラッパーや、検索可能な PDF 生成 (PDF のテキストの上に画像を表示) などの OCR コンポーネントもあります。
I would suggest Intel for its zero-cost runtime licensing.
これが皆さんが必要とする標準に完全に適合しているかどうかはわかりませんが、おそらくPaint.Net API のいくつかを調べたほうがよいでしょう。あなたのプロジェクトで使用するために画像処理アルゴリズムを抽出するのがどれほど簡単かはわかりませんが、あなたが探していることのいくつかを行うと信じています. さらに、これは MIT ライセンスのオープン ソース プロジェクトであるため、ビジネスでの使用には非常に使いやすいはずです。
KOFAX.com で KOFAX VRS について調べる
おそらく JMagick は、ImageMagick のオープン ソース Java インターフェイスです。これは、薄い Java Native Interface (JNI) レイヤーの形式で ImageMagick API に実装されます。LGPL の下でライセンスされているため、ライセンスに関して問題になることはありません。
元の画像の数と品質によって異なります。マネージ コードとイメージング ツール キットは機能しますが、数百万の画像を処理する必要がある場合、常に最適なソリューションとは限りません。小さなバッチと厳しい予算の場合、Aforge、Paint.NET、およびその他のオープン ソースのコンピューター ビジョン ライブラリなどのプロジェクトがうまくいくという以前のポスターに同意します。もちろん、結果が改善されない場合は自己責任です... 少なくともこれにより、低コストで必要なすべてを 1 つのアプリケーションの下に置くことができます。
1 か月に数十万枚の画像を処理している場合は、プロセスを小さなワークフロー ステップに分割し、画像あたりのコストができるだけゼロに近づくまで、それぞれを微調整することをお勧めします。OCR の結果は、最初は急速に上昇し、その後予想よりも早く横ばいになることがわかります。(私はOCRの大ファンではありませんが、その場所があります)
Recogniformの商用 Windows 製品を使用して、さまざまな種類の画像用に調整されたスクリプトを使用してバッチ モードで OCR の前に画像を処理およびクリーンアップします。画像が QC に合格しないか、OCR エンジンによって拒否された場合、Atalasoft のツールキットで構築されたカスタム .NET アプリケーションを使用して手動で「修復」されます。すべてをバッチ処理し、失敗したものだけに触れます。