ocr - 小さなフォントでtesseractOCRを改善する方法はありますか？

Question

python-tesseractを介してtesseract-OCRを使用して、次のような低解像度のフォントを読み取ろうとしています。

ここに画像の説明を入力してください

残念ながら、その画像は返されます

ZIJZHZI

解像度が低すぎて問題が発生していると思います。画像を拡大して個々の文字に切り抜いてみましたが、どちらもあまり改善されていません。他に検討すべきことはありますか？できればPython Imaging Libraryを使用して実行できることはありますか？または、私は正八胞体をあきらめる/訓練する必要があります。

その価値のために、PILには次の組み込みフィルターがあります。

BLUR、CONTOUR、DETAIL、EDGE_ENHANCE、
EDGE_ENHANCE_MORE、EMBOSS、FIND_EDGES、
SMOOTH、SMOOTH_MORE、およびSHARPEN

score 18 · Accepted Answer

私は画像を拡大しようとしました：

  convert -resize 400% in.bmp out.bmp

そしてそれを読んでください：

  tesseract out.bmp res

結果は正しいです：

ocr - 小さなフォントでtesseractOCRを改善する方法はありますか？

1 に答える 1

Related

Reference