明らかに、この画像は明瞭度が低く、実際の言葉ではないため、かなり厳しいものです。ただし、このコードでは、近いものは何も検出されません。
import pytesseract
from PIL import Image, ImageEnhance, ImageFilter
image_name = 'NedNoodleArms.jpg'
im = Image.open(image_name)
im = im.filter(ImageFilter.MedianFilter())
enhancer = ImageEnhance.Contrast(im)
im = enhancer.enhance(2)
im = im.convert('1')
im.save(image_name)
text = pytesseract.image_to_string(Image.open(image_name))
print(text)
出力
, Mdfiaodfiamms
ここに何かアイデアはありますか?私の対照関数が生成する画像は次のとおりです。
まともに見えるのはどっち?私はOCRの経験があまりありません。ここでどのような前処理をお勧めしますか? 画像のサイズを大きくしてみました。これは、PIL のさまざまなフィルターと一緒に、少しは役に立ちますが、十分ではありません。特に近いものはありませんが