私は最近、裏面にPerlコードが付いたTシャツを着ている人を見ました。私はそれの写真を撮り、コードを切り取りました:
次に、OCRを介して画像からコードを抽出しようとしたので、TesseractOCRとそのPythonバインディングであるpytesserをインストールしました。
PytesserはTIFF画像でのみ機能するため、Gimpで画像を変換し、次のコード(Ubuntu 9.10)を入力しました。
>>> from pytesser import *
>>> image = Image.open('code.tif')
>>> print image_to_string(image)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "pytesser.py", line 30, in image_to_string
util.image_to_scratch(im, scratch_image_name)
File "util.py", line 7, in image_to_scratch
im.save(scratch_image_name, dpi=(200,200))
File "/usr/lib/python2.6/dist-packages/PIL/Image.py", line 1406, in save
save_handler(self, fp, filename)
File "/usr/lib/python2.6/dist-packages/PIL/BmpImagePlugin.py", line 197, in _save
raise IOError("cannot write mode %s as BMP" % im.mode)
IOError: cannot write mode RGBA as BMP
>>> r,g,b,a = image.split()
>>> img = Image.merge("RGB", (r,g,b))
>>> print image_to_string(img)
Tesseract Open Source OCR Engine
éi _ l_` _ t
’ ‘" fY`
{ W IKQW
· __·_ ‘ ·-»·
:W Z
·· I A n 1
;f
` `
`T .' V _ ‘
I {Z.; » ;,. , ; y i- 4 : %:,,
`· » V; ` ?
‘,—·.
H***li¥v·•·}I§¢ ` _ »¢is5#__·¤G$++}§;“»‘7·
71 ’ Q { NH IQ
ytéggygi { ;g¤qg;gm·;,g(g,,3) {3;;+-
§ {Jf**$d$ }‘$p•¢L#d¤ Sc}
» i ` i A1:
これは、OCRエンジンから出てくる明らかにぎこちないものです。だから、私の質問は:
- Tesseractからより良いOCR結果を得るには、何をする必要がありますか?
- または、他の誰かが別の方法で上の画像からコードを抽出するより幸運がありますか?