13

python-tesseractを介してtesseract-OCRを使用して、次のような低解像度のフォントを読み取ろうとしています。

ここに画像の説明を入力してください

残念ながら、その画像は返されます

ZIJZHZI

解像度が低すぎて問題が発生していると思います。画像を拡大して個々の文字に切り抜いてみましたが、どちらもあまり改善されていません。他に検討すべきことはありますか?できればPython Imaging Libraryを使用して実行できることはありますか?または、私は正八胞体をあきらめる/訓練する必要があります。

その価値のために、PILには次の組み込みフィルターがあります。

BLUR、CONTOUR、DETAIL、EDGE_ENHANCE、
EDGE_ENHANCE_MORE、EMBOSS、FIND_EDGES、
SMOOTH、SMOOTH_MORE、およびSHARPEN

4

1 に答える 1

18

私は画像を拡大しようとしました:

  convert -resize 400% in.bmp out.bmp

そしてそれを読んでください:

  tesseract out.bmp res

結果は正しいです:

  100
于 2011-02-09T12:56:11.037 に答える