私は Tesseract を使用しており、一連の文字を認識できるアプリを開発したいと考えています。私は良い結果を出しましたが、優秀ではありませんでした。
私が読みたい文字シーケンスには、常に特定のパターンがあります。
数字 数字 数字 char char - (例: 123AB)
認識の結果を改善するために、構造が常に固定されていることをocrエンジンに「伝える」方法はありますか?
前もって感謝します。
私は Tesseract を使用しており、一連の文字を認識できるアプリを開発したいと考えています。私は良い結果を出しましたが、優秀ではありませんでした。
私が読みたい文字シーケンスには、常に特定のパターンがあります。
数字 数字 数字 char char - (例: 123AB)
認識の結果を改善するために、構造が常に固定されていることをocrエンジンに「伝える」方法はありますか?
前もって感謝します。
Tesseract でバザーマッチングパターンを試してください:
\d\d\d\c\c
「tessedit_char_whitelist」パラメーターを使用できます