私のプロジェクトでは、jpg ファイルのテキストをテキスト ファイルに書き写す必要があり、現在 tesseract を使用しています。ただし、この現在のレベルでは、tesseract は jpg ファイルのテキストの書き起こしをうまく行っていません。そこで、いくつかの画像前処理プログラムを使用して、画像ファイルをより最適化して tesseract にフィードすることにしました。
画像ファイルの例は次のとおりです: http://i46.tinypic.com/opramo.jpg
基本的に画像形式の古いニュース。
どの画像処理エンジンを使用するかについて何か提案はありますか??? ありがとうございました !