問題タブ [python-tesseract]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
562 参照

opencv - 車両に書かれたテキストのOCRを改善するには?

電車やトラックなどの車両のOCRを行って、それらに書かれた数字や文字を識別しようとしています。(これはナンバー プレート識別 OCR ではないことに注意してください)

この画像を撮りました。アイデアは、テキストを抽出できるようにすることです-それに書かれたBN SF 721 734。

ここに画像の説明を入力

前処理として、まずこの画像をグレースケールに変換してから、次のような 2 値化画像に変換しました。

ここに画像の説明を入力

私はtesseractでいくつかのコードを書きました。

このコードにより、信頼値 95 の空白の出力が得られました。これは、この画像にテキストが存在しないことを tesseract が 95% 信頼していたことを意味します。

次に、Tesseract の setrectangle API を使用して、画像全体で OCR を実行するのではなく、画像内の特定のウィンドウで OCR を制限しました。

座標 665、445、75、および 40 は、画像内のテキスト BNSF 721 734 を含む長方形に対応します。665 - 上、445 - 左、75 - 幅、40 - 高さ。

私が得た出力はこれでした:

私の質問は、どうすれば結果を改善できますか? setrectangle 関数の値をいじってみましたが、結果は少し異なりましたが、どれも同じように悪いものでした。

これを改善する方法はありますか?

画像を 2 値化した画像に変換する方法に興味がある場合は、OpenCV を使用しました

0 投票する
2 に答える
5932 参照

python - 2 つの pip3 パッケージの違い: pytesseract と tesseract

これら 2 つのパッケージの違いは何ですか?

pip3 install pytesseract

pip3 install tesseract