問題タブ [python-tesseract]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
opencv - 車両に書かれたテキストのOCRを改善するには?
電車やトラックなどの車両のOCRを行って、それらに書かれた数字や文字を識別しようとしています。(これはナンバー プレート識別 OCR ではないことに注意してください)
この画像を撮りました。アイデアは、テキストを抽出できるようにすることです-それに書かれたBN SF 721 734。
前処理として、まずこの画像をグレースケールに変換してから、次のような 2 値化画像に変換しました。
私はtesseractでいくつかのコードを書きました。
このコードにより、信頼値 95 の空白の出力が得られました。これは、この画像にテキストが存在しないことを tesseract が 95% 信頼していたことを意味します。
次に、Tesseract の setrectangle API を使用して、画像全体で OCR を実行するのではなく、画像内の特定のウィンドウで OCR を制限しました。
座標 665、445、75、および 40 は、画像内のテキスト BNSF 721 734 を含む長方形に対応します。665 - 上、445 - 左、75 - 幅、40 - 高さ。
私が得た出力はこれでした:
私の質問は、どうすれば結果を改善できますか? setrectangle 関数の値をいじってみましたが、結果は少し異なりましたが、どれも同じように悪いものでした。
これを改善する方法はありますか?
画像を 2 値化した画像に変換する方法に興味がある場合は、OpenCV を使用しました
python - 2 つの pip3 パッケージの違い: pytesseract と tesseract
これら 2 つのパッケージの違いは何ですか?
pip3 install pytesseract
pip3 install tesseract