問題タブ [hocr]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - HOCR出力を文字列に変換する戦略は何ですか(正規表現の目的で)?
私は Pytesseract を使用しており、HOCR 出力を文字列に変換したいと考えています。もちろん、そのような機能はPytesseractに実装されていますが、それを実現するための可能な戦略についてもっと知りたいですthx
tesseract - tika-server から hocr 出力を取得する
Apache TIKA サーバーを使用して PDF ファイルに OCR を実行しています。
hOCRの出力に興味がありますが、出力をプレーン テキスト形式でしか取得できません。
wikiとコードに従って、X-Tika-OCR...
HTTP ヘッダーを使用して Tesseract を構成しようとしています。この場合、X-Tika-OCRoutputType: hocr
HTTP ヘッダーを使用していますが、プレーン テキスト出力または HOCR タグのない html 出力が得られます。
/tika
と/rmeta
エンドポイントの両方を試しました。
私が使用するcurl
コマンド:
また、Accept
ヘッダーを text/plain、text/html、text/xhtml、text/hocr に設定してみました。どれも機能しません。最後のものはエラーになります。
私は使っている:
- アパッチティカ 1.22
- テセラクト 4.1.0-3.1.x86_64
- レッドハット 7
ocr - Google Cloud Vision OCR の X 座標と Y 座標を bbox 座標に変換する
Google Cloud Vision OCR には、境界ボックス オブジェクトの次の出力があります。
バウンディング ボックスの望ましい出力形式
これらの座標をバウンディング ボックスの座標に変換して、hOCR 形式で書き込みたいと思います。ファイルに書き込むための次の形式が含まれます。
質問?
- では、これらの x 座標と y 座標をこれらの bbox (バウンディング ボックス座標) に変換するにはどうすればよいでしょうか。
- これらは何ですか、
x
座標y
は (x_min
、y_max
) または (x_max
、y_min
) です。一般に、これらの x と y が何を表しているのかも知りたいですか?
画像の作業
テストとして次の画像に取り組んでいます。