0

画像からテキストを取得するために Tesseract ライブラリを実装しようとしていますが、場合によっては機能しますが、ほとんどの場合失敗します。

Android プロジェクトでこのライブラリを使用しています: https://github.com/rmtheis/tess-two

私はこの画像で試しています

ここに画像の説明を入力

実結果

ここに画像の説明を入力

期待される結果

ウィキペディア

フリー百科事典

なぜそれが機能しないのかについての提案はありますか?

4

1 に答える 1

0

次の理由で機能していません。

  • 画像の照度ムラ
  • キャプチャされた画像の上部にある地球儀のグラフィックの一部の存在。

画面の写真を撮ることで、キャプチャされた画像に暗い領域がいくつか導入されます。これを修正するには、写真を撮る代わりに画像を直接使用するか、アプリにコードを追加して、不均一な照明を調整することができます。

さまざまな照明を使用し、テキスト領域をトリミングすると、より良い結果が得られます。

正しい認識を示す OCR 結果

于 2014-06-08T18:04:40.067 に答える