2

Tesseract は、テキストのみを含む画像に対して機能します。しかし、テキストと画像があり、テキストのみを認識させたい場合はどうでしょう。

画像からのテキストのOCR認識にTesseractを使用しています。Tesseract は、テキストのみが含まれている画像から正確なテキストを提供しています。しかし、車とその車の番号が含まれている画像を確認すると、Tesseract は別の文字化けした車の番号を表示しました。グレースケールの最適化、しきい値、およびその他の効果を適用して、正確なテキスト出力を取得し、出力の精度を高めましたが、それでも異なるエンコーディングと混合された異なるテキストが得られます. 同じように、そのようなテキストを抽出する他の方法を探しています。

Tesseract OCRまたは代替手段を使用してそのような画像からテキストを取得し、テキスト部分のみが画像に残るようにして、Tesseractが正確なテキストを出力できるようにする方法を誰でも知っていますか?

画像をトリミングすることは、テキストのみを取得するための 1 つの方法ですが、ImageMagick またはその他のオプションを使用してそれを行う方法です。

ありがとう。

4

1 に答える 1

3

画像のどこにテキストがあるかが正確にわかっている場合は、それらの領域の座標を画像と一緒にTesseractに送信して認識させることができます。TesseractAPIメソッドTesseractRectまたはを見てくださいSetRectangle

于 2012-11-30T02:02:59.893 に答える