これまで Python を使用したことがなく、どこから始めればよいかわかりません。私の目標は、数字と多色の背景の画像データを取得し、正しい文字を確実に識別できるようにすることです。これに必要なツールを調べたところ、tesseract-ocr と pytesser だけでなく、必要になる可能性のあるすべてのパッケージが含まれている Anaconda Python ディストリビューションを見つけました。
残念ながら、私は始め方に迷っています。私は PyCharm Community IDE を使用しており 、OCR を把握するためにhttp://www.manejandodatos.es/2014/11/ocr-python-easy/のガイドに従っているだけです。
これは私が使用しているコードです:
from PIL import Image
from pytesser import *
image_file = 'menu.jpg'
im = Image.open(image_file)
text = image_to_string(im)
text = image_file_to_string(image_file)
text = image_file_to_string(image_file, graceful_errors=True)
print "=====output=======\n"
print text
私が使用しているAnacondaディストリビューションにはPILがあると思いますが、次のエラーが発生しています:
C:\Users\diego_000\Anaconda\python.exe C:/Users/diego_000/PycharmProjects/untitled/test.py
Traceback (most recent call last):
File "C:/Users/diego_000/PycharmProjects/untitled/test.py", line 2, in <module>
from pytesser import *
File "C:\Users\diego_000\PycharmProjects\untitled\pytesser.py", line 6, in <module>
import Image
ImportError: No module named Image
Process finished with exit code 1
誰かが私を正しい方向に向けることができますか?