1

(一般的な知識のために、ここで自分の質問に答えます)

Tesseract OCR では、上下逆の画像をどのように検出しますか?
Tesseract を使用したことがある人は、Tesseractが上下逆さまに表示されている画像を読み取ることができることを知っているかもしれませんし、知らないかもしれません。
ただし、問題は、ドキュメントのどこにも記載されていないため、hOCR 出力を使用する場合に逆さまであることを知らないことです。

では、どのようにそれを検出するのですか?

4

1 に答える 1

-1

再確認したところ、実際には hOCR 出力に直接含まれていないことに気付きましたocr_page div。方向を示す属性に何らかの属性があると予想されます。

私が理解したのは、ocr_careaページごとにすべての の境界ボックスの y 値を読み取ることができるということです。

  • 値が低い値から高い値に変化する場合、ページは通常の向きです。
  • 値が高いものから低いものに変わる場合、ページは上下逆になっています。

これは、90 度および 270 度の回転では機能する場合と機能しない場合がありますが、x 値について同様のパターンが見られる可能性が非常に高くなります。

于 2014-01-03T19:16:21.283 に答える