Tesseract-OCRを使用して、純粋なテキストを含む画像のテキストを検出しようとしていますが、これらのテキストにはJournalと呼ばれる手書きフォントがあります。
例:
結果は最高ではありません:
マキシマ!サイズ`W(35)
結果を改善する可能性はありますか、それとも正確な結果を得る可能性はありますか?
Tesseract-OCRを使用して、純粋なテキストを含む画像のテキストを検出しようとしていますが、これらのテキストにはJournalと呼ばれる手書きフォントがあります。
例:
結果は最高ではありません:
マキシマ!サイズ`W(35)
結果を改善する可能性はありますか、それとも正確な結果を得る可能性はありますか?
Tesseractがとてもうまくやっていることに私は驚いています。少しトレーニングすれば、小文字の「l」が正しく認識されるようにトレーニングできるはずです。
あなたが抱えている主な問題は、大きなT文字の上部です。水平線は他の2つ(場合によっては3つ)の文字セルにまたがっており、認識のために文字をセグメント化しようとすると、OCRエンジンで問題が発生します。この場合、トレーニングが役立つ場合があります。
次の問題はです。および:これは非常に軽く/薄く、OCRが開始する前に画像の前処理で削除される可能性があります。
全体として、Tesseractで結果を改善する唯一のチャンスは、トレーニングを調査することです。ここに役立つかもしれないいくつかのリンクがあります。
Tesseract OCRトレーニングの代わりに?
TesseractOCRライブラリ学習フォント
Tesseractは2つの数字を混同します
Andrew Cashが述べたように、次の文字の数と交差するため、そのT文字に対してOCRを実行するのは非常に困難です。
結果を改善するために、より正確なSDKを試してみることをお勧めします。ABBYY CloudOCRSDKをご覧ください。これは最近ABBYYによってリリースされたクラウドベースのOCRSDKです。ベータ版なので、今のところ完全に無料で使用できます。私は@ABBYYで働いており、必要に応じて当社の製品に関する追加情報を提供できます。SDKに添付した画像を送信し、次の応答を受け取りました。
Maximal size: lall (35)