tesseract - 認識した文字の座標を取得する方法

Question

私は Tesseract に基づく非常に単純な OCR アプリを持っています。認識ステップの後、OCR が間違っている場合に修正できるユーザー検証ステップも提供します。ユーザーインターフェイスを改善するために、元の入力画像の OCR 処理された文字の上に四角形を描画し、OCR 出力と並べて配置する予定です。そのためには、認識された文字の座標が必要です。

私はこのようなことを試しましたが、意味不明になるようです:

   ETEXT_DESC output;
   tess->Recognize(&output);
   text = tess->GetUTF8Text();

ここで、output->count にアクセスすると、10,000 を超える値が得られます。これは、画像全体に 20 文字程度しかないため、明らかに間違っています。

私は正しい軌道に乗っていますか？方向性を教えてください。

score 6 · Accepted Answer

ボックスの座標を取得すると役立つ場合があります。tesseractの実行可能ファイルを試してください。コマンドを使用する

「tesseract.exe[画像][出力]makebox」

結局、各文字の座標を1行に1つずつ取得します。次に、比較することができます。

score 1 · Accepted Answer

実行可能ファイルには、認識された文字とその座標をhtml形式で出力tesseractするオプションhocrがあります。これをプログラムで取得するには、FAQにを参照するように記載されています。baseapi.h

tesseract - 認識した文字の座標を取得する方法

2 に答える 2

Related

Reference