python - OCR の画像前処理 - Tessaract

翻译自：https://stackoverflow.com/questions/51688973 2018-08-04T19:33:16.580

4530 次

明らかに、この画像は明瞭度が低く、実際の言葉ではないため、かなり厳しいものです。ただし、このコードでは、近いものは何も検出されません。

import pytesseract
from PIL import Image, ImageEnhance, ImageFilter
image_name = 'NedNoodleArms.jpg'
im = Image.open(image_name) 
im = im.filter(ImageFilter.MedianFilter())
enhancer = ImageEnhance.Contrast(im)
im = enhancer.enhance(2)
im = im.convert('1')
im.save(image_name)
text = pytesseract.image_to_string(Image.open(image_name))
print(text)

出力

, Mdﬁaodﬁamms

ここに何かアイデアはありますか？私の対照関数が生成する画像は次のとおりです。

まともに見えるのはどっち？私はOCRの経験があまりありません。ここでどのような前処理をお勧めしますか? 画像のサイズを大きくしてみました。これは、PIL のさまざまなフィルターと一緒に、少しは役に立ちますが、十分ではありません。特に近いものはありませんが

python - OCR の画像前処理 - Tessaract

1 に答える 1

Related

Reference