私は現在、次のような数値を読み取るためにtesseractを使用する必要があるPythonでスクリプトを書いています:
数字のみと -psm 6 (または 7) を使用すると、5.551 が出力されます。
私は他の数字 (5.700 作品) である程度の成功を収めましたが、この特定の数字は私に多くの問題を与えています. 残念ながら、私のプログラムには高度な精度が必要ですが、tesseract はそのような単純な文字列を解読できると思いました。
私もGOCRを使用しようとしましたが、それは正しく6.881を読み取りました(yay!)が、5.700に対して出力5._00を与えました(ブー!)
なぜこれを行うのか、何か考えはありますか?
またはもっと重要なことに、問題を回避するために私ができることは何でも(できれば tesseract を訓練する必要はありません)。