私はtesseract OCRエンジンを使用してiPhone用のOCRプロジェクトに取り組んでいます。次のモジュールを作成する予定です。
- iPhoneカメラから画像をキャプチャ
- OCR出力を改善するために、画像を前処理して調整します。
- OCR 出力を意味のあるフィールドに分割します。
- 未定義の文字を無視するために、OCR エンジンのいくつかのルールを定義します。(たとえば、OCR出力が文字
0226s5242
を無視する場合s
)
これらのモジュールに関連するトピックの学習を開始したいのですが、OCR 関連の手法については知りません。アドバイスがあれば非常に役立ちます。ありがとうございます。