問題タブ [python-tesseract]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

1353 問題

0 投票する

1 に答える

562 参照

opencv - 車両に書かれたテキストのOCRを改善するには?

電車やトラックなどの車両のOCRを行って、それらに書かれた数字や文字を識別しようとしています。(これはナンバープレート識別 OCR ではないことに注意してください)

この画像を撮りました。アイデアは、テキストを抽出できるようにすることです-それに書かれたBN SF 721 734。

前処理として、まずこの画像をグレースケールに変換してから、次のような 2 値化画像に変換しました。

私はtesseractでいくつかのコードを書きました。

このコードにより、信頼値 95 の空白の出力が得られました。これは、この画像にテキストが存在しないことを tesseract が 95% 信頼していたことを意味します。

次に、Tesseract の setrectangle API を使用して、画像全体で OCR を実行するのではなく、画像内の特定のウィンドウで OCR を制限しました。

座標 665、445、75、および 40 は、画像内のテキスト BNSF 721 734 を含む長方形に対応します。665 - 上、445 - 左、75 - 幅、40 - 高さ。

私が得た出力はこれでした：

私の質問は、どうすれば結果を改善できますか? setrectangle 関数の値をいじってみましたが、結果は少し異なりましたが、どれも同じように悪いものでした。

これを改善する方法はありますか？

画像を 2 値化した画像に変換する方法に興味がある場合は、OpenCV を使用しました

2017-02-11T22:30:56.277

0 投票する

2 に答える

5932 参照

python - 2 つの pip3 パッケージの違い: pytesseract と tesseract

これら 2 つのパッケージの違いは何ですか?

pip3 install pytesseract

pip3 install tesseract

python python-3.x pip tesseract python-tesseract

2017-02-19T19:19:13.503

1 2 3 4 5 6 7 8 9 10

問題タブ [python-tesseract]

opencv - 車両に書かれたテキストのOCRを改善するには?

python - 2 つの pip3 パッケージの違い: pytesseract と tesseract

Reference