36

画像があり、その中のテキスト領域を検出したいと考えています。

TiRG_RAW_20110219 プロジェクトを試しましたが、満足のいく結果が得られませんでした。入力画像がhttp://imgur.com/yCxOvQS,GD38rCaの場合、出力としてhttp://imgur.com/yCxOvQS,GD38rCa#1が生成されます。

誰でも代替案を提案できますか。テキスト領域のみを入力として送信することで、tesseract の出力を改善したかったのです。

4

3 に答える 3

5

手を汚してもかまわない場合は、これらのテキスト領域を 1 つの大きな長方形の領域に拡大してみてください。これを一度にテッセラクトにフィードします。

また、画像を数回しきい値処理し、それらのそれぞれを個別にテッセラクトに供給して、それがまったく役立つかどうかを確認することもお勧めします。出力を辞書の単語と比較して、特定の OCR 結果が良好かどうかを自動的に判断できます。

于 2015-06-23T20:47:58.380 に答える