英数字と数字のみのサンプル テキストでテストしました。数字モードを使用しています。
次の画像のように数字を認識する方法は次のとおりです。
全高のせいだと思います。また、いくつかのオンライン ツール (コードではない) を使用して、.jpg に変換しようとしました。
私はpytesseract 0.1.6を使用していますが、これはTesseractの問題だと思います。
これが私のコードです:
def classify(hash):
socket = urllib.urlopen(hash)
image = StringIO(socket.read())
socket.close()
image = Image.open(image)
number = image_to_string(image, config='digits')
mapping[hash] = number
return number
classify('any url')