私は Tesseract に基づく非常に単純な OCR アプリを持っています。認識ステップの後、OCR が間違っている場合に修正できるユーザー検証ステップも提供します。ユーザー インターフェイスを改善するために、元の入力画像の OCR 処理された文字の上に四角形を描画し、OCR 出力と並べて配置する予定です。そのためには、認識された文字の座標が必要です。
私はこのようなことを試しましたが、意味不明になるようです:
ETEXT_DESC output;
tess->Recognize(&output);
text = tess->GetUTF8Text();
ここで、output->count にアクセスすると、10,000 を超える値が得られます。これは、画像全体に 20 文字程度しかないため、明らかに間違っています。
私は正しい軌道に乗っていますか?方向性を教えてください。