numbers - Tesseract は 7 と 1 を混同し、テキストに対して何も返しません。

翻译自：https://stackoverflow.com/questions/14093184 2012-12-30T18:05:39.593

422 次

数字といくつかのテキストのフィールドを使用して、スキャンされたフォームを OCR しようとしています。ただし、トリミングされたテキストに対して tesseract を実行しても、正しい結果は得られません。

たとえば、数値 7 の場合: ナンバー7

実行時の結果は 1 です。

tesseract -psm 10 7test.jpg out digits

7を介してストロークにもかかわらず。

一方、テキストフィールドの場合はさらに難しく、次のフィールドでは何も得られません。

テスト名

ここで精度を向上させる簡単な方法はありますか? フォームが手書きであるため、理想的には優れたトレーニングセットを作成することは避けてください。

名前フィールドでは、向きを改善してフィールドを囲む線を削除できる可能性がありますが、出力がないことが心配です。

数字については、おそらくフォームから手動のトレーニングセットを作成することを除いて、私にはわかりません。

0 に答える 0