python - Opencvを使用して画像内のテキスト領域を検出

Question

画像があり、その中のテキスト領域を検出したいと考えています。

TiRG_RAW_20110219 プロジェクトを試しましたが、満足のいく結果が得られませんでした。入力画像がhttp://imgur.com/yCxOvQS,GD38rCaの場合、出力として http://imgur.com/yCxOvQS,GD38rCa#1が生成されます。

誰でも代替案を提案できますか。テキスト領域のみを入力として送信することで、tesseract の出力を改善したかったのです。

score 5 · Accepted Answer

手を汚してもかまわない場合は、これらのテキスト領域を 1 つの大きな長方形の領域に拡大してみてください。これを一度にテッセラクトにフィードします。

また、画像を数回しきい値処理し、それらのそれぞれを個別にテッセラクトに供給して、それがまったく役立つかどうかを確認することもお勧めします。出力を辞書の単語と比較して、特定の OCR 結果が良好かどうかを自動的に判断できます。

3 に答える 3