ocr - 手書きのスキャン文書を識別するための無料の OCR エンジンまたは API はありますか?

翻译自：https://stackoverflow.com/questions/18141361 2013-08-09T06:44:06.230

233 次

1

Google Tesseract エンジン python バインダーhttps://code.google.com/p/python-tesseract/を使用して、画像内のテキストを抽出しています ( http://ceoarunachal.nic.in/eci/affidavits/s02/ge/ 1/KIREN%20RIJIJU/KIRENRijiju_SC1.jpg )。それに似た何千もの画像をデジタル化しようとしています。しかし、Tesseract は主に機械テキスト用に設計されているため、手書きテキストを正しく抽出できません。

データをトレーニングすることで認識を改善するのに役立つ現在の画像を最適化する方法はありますか、それを行うための他のより良いツールはありますか?

0 に答える 0