問題タブ [hocr]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

34 問題

0 投票する

1 に答える

757 参照

python - HOCR出力を文字列に変換する戦略は何ですか(正規表現の目的で)?

私は Pytesseract を使用しており、HOCR 出力を文字列に変換したいと考えています。もちろん、そのような機能はPytesseractに実装されていますが、それを実現するための可能な戦略についてもっと知りたいですthx

2019-08-09T15:40:25.940

0 投票する

1 に答える

353 参照

tesseract - tika-server から hocr 出力を取得する

Apache TIKA サーバーを使用して PDF ファイルに OCR を実行しています。

hOCRの出力に興味がありますが、出力をプレーンテキスト形式でしか取得できません。

wikiとコードに従って、X-Tika-OCR...HTTP ヘッダーを使用して Tesseract を構成しようとしています。この場合、X-Tika-OCRoutputType: hocrHTTP ヘッダーを使用していますが、プレーンテキスト出力または HOCR タグのない html 出力が得られます。

/tikaと/rmetaエンドポイントの両方を試しました。

私が使用するcurlコマンド：

また、Acceptヘッダーを text/plain、text/html、text/xhtml、text/hocr に設定してみました。どれも機能しません。最後のものはエラーになります。

私は使っている：

アパッチティカ 1.22
テセラクト 4.1.0-3.1.x86_64
レッドハット 7

tesseract apache-tika tika-server hocr

2020-01-09T10:40:25.017

0 投票する

1 に答える

51 参照

ocr - Google Cloud Vision OCR の X 座標と Y 座標を bbox 座標に変換する

Google Cloud Vision OCR には、境界ボックスオブジェクトの次の出力があります。

バウンディングボックスの望ましい出力形式

これらの座標をバウンディングボックスの座標に変換して、hOCR 形式で書き込みたいと思います。ファイルに書き込むための次の形式が含まれます。

質問？

では、これらの x 座標と y 座標をこれらの bbox (バウンディングボックス座標) に変換するにはどうすればよいでしょうか。
これらは何ですか、x座標yは ( x_min、y_max) または ( x_max、y_min) です。一般に、これらの x と y が何を表しているのかも知りたいですか?

画像の作業

テストとして次の画像に取り組んでいます。

ocr google-cloud-vision hocr

2021-12-17T04:26:58.933

1 2 3 4 5 6 7 8 9 10

問題タブ [hocr]

python - HOCR出力を文字列に変換する戦略は何ですか(正規表現の目的で)?

tesseract - tika-server から hocr 出力を取得する

ocr - Google Cloud Vision OCR の X 座標と Y 座標を bbox 座標に変換する

バウンディング ボックスの望ましい出力形式

質問？

画像の作業

Reference

バウンディングボックスの望ましい出力形式