Tesseract は、テキストのみを含む画像に対して機能します。しかし、テキストと画像があり、テキストのみを認識させたい場合はどうでしょう。
画像からのテキストのOCR認識にTesseractを使用しています。Tesseract は、テキストのみが含まれている画像から正確なテキストを提供しています。しかし、車とその車の番号が含まれている画像を確認すると、Tesseract は別の文字化けした車の番号を表示しました。グレースケールの最適化、しきい値、およびその他の効果を適用して、正確なテキスト出力を取得し、出力の精度を高めましたが、それでも異なるエンコーディングと混合された異なるテキストが得られます. 同じように、そのようなテキストを抽出する他の方法を探しています。
Tesseract OCRまたは代替手段を使用してそのような画像からテキストを取得し、テキスト部分のみが画像に残るようにして、Tesseractが正確なテキストを出力できるようにする方法を誰でも知っていますか?
画像をトリミングすることは、テキストのみを取得するための 1 つの方法ですが、ImageMagick またはその他のオプションを使用してそれを行う方法です。
ありがとう。