5

私は Tesseract に基づく非常に単純な OCR アプリを持っています。認識ステップの後、OCR が間違っている場合に修正できるユーザー検証ステップも提供します。ユーザー インターフェイスを改善するために、元の入力画像の OCR 処理された文字の上に四角形を描画し、OCR 出力と並べて配置する予定です。そのためには、認識された文字の座標が必要です。

私はこのようなことを試しましたが、意味不明になるようです:

   ETEXT_DESC output;
   tess->Recognize(&output);
   text = tess->GetUTF8Text();

ここで、output->count にアクセスすると、10,000 を超える値が得られます。これは、画像全体に 20 文字程度しかないため、明らかに間違っています。

私は正しい軌道に乗っていますか?方向性を教えてください。

4

2 に答える 2

6

ボックスの座標を取得すると役立つ場合があります。tesseractの実行可能ファイルを試してください。コマンドを使用する

「tesseract.exe[画像][出力]makebox」

結局、各文字の座標を1行に1つずつ取得します。次に、比較することができます。

于 2012-03-16T13:38:45.980 に答える
1

実行可能ファイルには、認識された文字とその座標をhtml形式で出力tesseractするオプションhocrがあります。これをプログラムで取得するには、FAQに を参照するように記載されています。baseapi.h

于 2013-04-03T04:47:11.977 に答える