こんにちは、.NET で OCR のコンポーネントを試したところ、結果はかなり不正確でした。他の誰かが以前にこのルートをたどったことがありますか? 満足のいく結果が得られない多数のコンポーネントを評価する時間を節約するための方法を教えてください。
どんな推奨事項も大歓迎です。自分で購入したり、コーディングしたりしてもかまいません。最も効果的で費用対効果の高いものは何でも。
ありがとう
プロジェクトではAbby Fine Reader SDKを使用しました。.Net アプリケーションで使用できる COM オブジェクトが付属しています。エンジンの成功は十分です。
代替エンジンの情報については、https://stackoverflow.com/a/18070183/852208を参照してください。
精度の問題がライブラリ自体に関連している可能性があります。ただし、作業している画像ソースである可能性が高くなります。次のヒントを考慮してください。
テキストに関する考慮事項
- 標準の OCR は、特定の素材に対して試みるべきではありません。たとえば、現在、デフォルト設定の OCR は、
1850 年より前に出版されたほとんどのテキストに対して試みるべきではありません。一部の言語 (
ドイツ語など) では、カットオフ日がさらに遅くなる場合があります。OCR を介してこれらの資料の文字起こしを作成しようとする前に、カスタム OCR とキーボード入力オプション の間のトレードオフを判断するために
、詳細な分析と多くの場合実験が必要です。- すべての画像データをキャプチャし、OCR の精度を最大限に高めるには、古くて変色したドキュメントを RGB モードでスキャンする必要があります。
- コントラストの低いドキュメントでは、OCR が不十分になる可能性があります。
- タイプスクリプトは、印刷されたタイプよりも OCR が劣ります。フォント フェイスとサイズを一貫して使用しないと、OCR の精度が低下する可能性があります。
- 元のフォント サイズが 6 ポイント未満の場合、OCR が制限される可能性がありますが、スキャンした画像の解像度を 600 dpi に上げてグレースケールを使用すると、OCR 出力が向上する場合があります。
- 手書きの文書は、正確に認識できません。
OCR の精度に影響を与えるスキャンに関する考慮事項には、次のようなものがあります。
- OCR の精度を高めるために推奨される最適なスキャン解像度は 300 dpi です。解像度が高いほど精度が向上するとは限らず、OCR 処理時間が遅くなる可能性があります。300 dpi 未満の解像度は、OCR 結果の品質と精度に影響を与える可能性があります。
- 輝度設定が高すぎたり低すぎたりすると、OCR の精度に悪影響を及ぼす可能性があります。ほとんどの場合、50% の中程度の明るさの値が適しています。
- 最初のスキャンの正確性は、OCR の品質に影響を与える可能性があります。テキストの行が曲がっていると、結果が悪くなります。
- すべての画像データをキャプチャし、OCR の精度を最大限に高めるには、古くて変色したドキュメントを RGB モードでスキャンする必要があります。
- コントラスト調整やアンシャープ マスクなどの画像強調によって、OCR の精度が大幅に向上することは示されていません。
ABBYY のコンポーネントはかなり高価です。私は Pegasus ImagXpress と Atalasoft DotImage を評価しました。フルページ OCR では DotImage の方が正確であることがわかりましたが、認識が困難なテキストの特定の小さな部分は ImagXpress の方が読みやすくなりました。両方のデモ版を試して、ニーズに最適なものを確認することをお勧めします。