tesseract - Tesseract OCR が全高の数字を認識できませんでした

翻译自：https://stackoverflow.com/questions/29441018 2015-04-03T23:24:33.113

1656 次

英数字と数字のみのサンプルテキストでテストしました。数字モードを使用しています。

次の画像のように数字を認識する方法は次のとおりです。

ここに画像の説明を入力

全高のせいだと思います。また、いくつかのオンラインツール (コードではない) を使用して、.jpg に変換しようとしました。

私はpytesseract 0.1.6を使用していますが、これはTesseractの問題だと思います。

これが私のコードです：

def classify(hash):
  socket = urllib.urlopen(hash)
  image = StringIO(socket.read())
  socket.close()
  image = Image.open(image)
  number = image_to_string(image, config='digits')
  mapping[hash] = number
  return number

classify('any url')

tesseract - Tesseract OCR が全高の数字を認識できませんでした

2 に答える 2

Related

Reference