(一般的な知識のために、ここで自分の質問に答えます)
Tesseract OCR では、上下逆の画像をどのように検出しますか?
Tesseract を使用したことがある人は、Tesseractが上下逆さまに表示されている画像を読み取ることができることを知っているかもしれませんし、知らないかもしれません。
ただし、問題は、ドキュメントのどこにも記載されていないため、hOCR 出力を使用する場合に逆さまであることを知らないことです。
では、どのようにそれを検出するのですか?
再確認したところ、実際には hOCR 出力に直接含まれていないことに気付きましたocr_page
div
。方向を示す属性に何らかの属性があると予想されます。
私が理解したのは、ocr_carea
ページごとにすべての の境界ボックスの y 値を読み取ることができるということです。
これは、90 度および 270 度の回転では機能する場合と機能しない場合がありますが、x 値について同様のパターンが見られる可能性が非常に高くなります。