Python で Tesseract OCR を使用して画像ファイルからテキストを抽出しようとしていますが、対処方法を理解できるというエラーに直面しています。Pythonのocrでサンプル画像をテストしたので、私の環境はすべて良好です!
ここにコードがあります
from PIL import Image
import pytesseract
strs = pytesseract.image_to_string(Image.open('binarized_image.png'))
print (strs)
以下は、Eclipseコンソールから取得したエラーです
strs = pytesseract.image_to_string(Image.open('binarized_body.png'))
File "C:\Python35x64\lib\site-packages\pytesseract\pytesseract.py", line 167, in image_to_string
return f.read().strip()
File "C:\Python35x64\lib\encodings\cp1252.py", line 23, in decode
return codecs.charmap_decode(input,self.errors,decoding_table)[0]
UnicodeDecodeError: 'charmap' codec can't decode byte 0x9d in position 20: character maps to <undefined>
Windows10でpython 3.5 x64を 使用しています