ほとんどが既知のレイアウトであるラベルからいくつかの特定の情報をOCRする必要があります。データのソースは、トリッキーになる可能性があることを私が知っている写真です。データは、バーコード(簡単)、短いテキスト(ほとんどの場合、繰り返されるときに学習できる既知の単語)、および数字(形式と長さを設定)にすることができます。
私はいくつかの調査を行いましたが、Tesseractは複数のプラットフォームで私が望むことを実行できるようですが、いくつか質問があります。
1)関連するラベルのみをトリミングするにはどうすればよいですか。私はずっと前に大学のコースで非常に基本的な信号処理を行いました。これはそれほど難しいことではないと思います。そのための良いライブラリはありますか?
2)レイアウトを知っているので、必要な特定の値ごとにセクションごとにラベルをOCRする方法はありますか?
3)写真の前処理に関するその他のヒントはありますか?
4)Tesseractはその仕事に適したツールですか?