2

一部のテキスト画像は tesseract で認識されません。

たとえばrails、tesseract によって認識されない次の画像を考えてみましょう

ここに画像の説明を入力

上の画像は、OCRed の場合、出力がありません。

また、一部の画像の精度は基準に達していません。

私はRuby on Railsを使用しており、tesseract OCRテキスト認識を実装するために「gem tesseract」といくつかのコードを使用しています。何が問題なのか、どうすれば出力を正確に取得できますか。

4

1 に答える 1

2

問題は、Tesseract がテキストのみの画像を対象としていることです。投稿したような画像の結果は保証されません。

いくつかの画像処理 (テキスト部分のみに画像をトリミング) を行い、画像を白地に黒のテキストに変換する必要があります。

于 2012-12-11T07:55:45.473 に答える