0

ほとんどが既知のレイアウトであるラベルからいくつかの特定の情報をOCRする必要があります。データのソースは、トリッキーになる可能性があることを私が知っている写真です。データは、バーコード(簡単)、短いテキスト(ほとんどの場合、繰り返されるときに学習できる既知の単語)、および数字(形式と長さを設定)にすることができます。

私はいくつかの調査を行いましたが、Tesseractは複数のプラットフォームで私が望むことを実行できるようですが、いくつか質問があります。

1)関連するラベルのみをトリミングするにはどうすればよいですか。私はずっと前に大学のコースで非常に基本的な信号処理を行いました。これはそれほど難しいことではないと思います。そのための良いライブラリはありますか?

2)レイアウトを知っているので、必要な特定の値ごとにセクションごとにラベルをOCRする方法はありますか?

3)写真の前処理に関するその他のヒントはありますか?

4)Tesseractはその仕事に適したツールですか?

4

1 に答える 1

0

以前は Tesseract を扱ったことがありませんでした。ただし、leadtools という別のサードパーティ ツールキットを使用しています。このツールキットは、バーコード、テキスト、数字を認識し、結果をドキュメント形式で保存できます。認識したいテキストの周りに特定のゾーンを描画する方法を提供し、画像を前処理する方法がいくつかあるため、要件を満たすことができます。また、OCR するファイル内のゾーンを自動的に検出する機能も提供します。詳細については、このチュートリアルを確認してください。

于 2012-11-01T15:22:52.163 に答える