問題タブ [hocr]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
14739 参照

ocr - Tesseract の hOCR 出力には、各文字の境界ボックスと信頼レベルが本当に含まれていますか?

Tesseract FAQでは、次のことができると言われています。

各キャラクターの座標と信頼度を取得するにはどうすればよいですか?

2 つのオプションがあります。プログラミングをしたくない場合は、Tesseract の hocr 出力形式を使用できます (詳細については、Tesseract のマニュアル ページを参照してください)。

しかし、サンプルの hOCR 出力 (.html ファイル) を作成したとき、境界ボックスと信頼レベルは単語レベルでしか利用できませんでした。

ここで何か不足していますか?

サンプルの入力/出力を図として追加しました (入力のサイズが変更されています)。


これは入力画像です:

ここに画像の説明を入力


これは Tesseract の hOCR 出力です。

0 投票する
1 に答える
1409 参照

image - Tesseract hOCR:逆さまを検出する方法は?

(一般的な知識のために、ここで自分の質問に答えます)

Tesseract OCR では、上下逆の画像をどのように検出しますか?
Tesseract を使用したことがある人は、Tesseractが上下逆さまに表示されている画像を読み取ることができることを知っているかもしれませんし、知らないかもしれません。
ただし、問題は、ドキュメントのどこにも記載されていないため、hOCR 出力を使用する場合に逆さまであることを知らないことです。

では、どのようにそれを検出するのですか?

0 投票する
1 に答える
601 参照

ios - Tesseract hOCR iOS

Tesseract API の使い方を学んでいて、hOCR 出力関数に興味があります。現在、このコードを使用して画像をスキャンしています。

すべて正常にコンパイルされていますが、hOCR 関数によって返される .html を格納する方法を知りたいです。変数内に格納できますか? 生成された後、プログラムでこのファイルにアクセスできる必要があります。iOS で hOCR を使用する方法についての洞察をいただければ幸いです。

0 投票する
2 に答える
5764 参照

python - hOCR を HTML テーブルに変換する

hOCRファイル(アプリケーションによってtesseractによって生成された)をhtmlテーブルに変換するツールまたはPythonに実装されるアイデアを探しています。アイデアは、hOCR ファイル (bbox 属性で提供される) のテキストの場所情報を利用して、提供された場所に基づいてテーブルを作成することです。上記のアイデアを説明する例を提供しています。

SlideShare.net のこの画像を、tesseract を利用するアプリケーションへの入力として使用し、以下の hOCR/xml ファイルを出力として取得しました。

hOCR ファイル:

必要なのは、次の場所に基づいて hOCR ファイルを html テーブルに変換することです。目的のテーブルは、このテーブルのようになります。

表のセルのサイズと位置は、hOCR ファイルで提供される情報を反映しています。

画像ソース:slideshare.net

0 投票する
3 に答える
12905 参照

tesseract - python-tesseract を使用して Hocr 出力を取得する方法

私は pytesseract を使用して本当に良い結果を得ていましたが、ダブルスペースを保持することができず、それらは私にとって本当に重要です. そこで、純粋なテキストではなく hocr 出力を取得することにしました。しかし、pytessearct を使用して構成ファイルを指定する方法はないようです。

それで、pytesseractを使用して構成ファイルを指定することは可能ですか、それともhocr出力を得るために変更できるデフォルトの構成ファイルがありますか?

0 投票する
0 に答える
427 参照

pdf - tesseract が pdf ファイル用に作成する非表示のテキスト レイアウトを取得するにはどうすればよいですか?

私はocrの経験があまりありません。これが私が試したことです:

  1. tesseract -l eng -psm 1 image_str007_0001.jpg image_str007_tess pdf

    その結果、完全に構造化された隠しテキスト レイアウトが作成されます。PDF を検索すると、単語は正確な場所に表示されます。私の質問は、このレイアウトをファイル (hocr または html) として取得できますか? (API ではなく、設定パラメータが優先されます。)

    私が試したこと:

  2. tesseract -l eng -psm 1 image_str007_0001.jpg 出力 hocr

  1. hocr2pdf -i image_str007_001 -o output.pdf < output.hocr

    ファイル output.pdf では、テキストを検索すると単語がひどく間違って配置されています。コマンド 2. は tesseract hocr レイアウト ファイルを作成するのに正しくありませんか、それとも hocr2pdf アプリは pdf を正しく作成しませんか?

0 投票する
1 に答える
998 参照

c# - c# charlesw tesseract を使用して hocr ファイルを生成する

ここでtesseractラッパーを使用してhocrを生成するにはどうすればよいですか

現在、tessdata の場所を環境変数に動的に追加し、コードを実行する必要があります

そして、tesseractラッパーを見つけました。ラッパーを使用して hocr ファイルを生成するにはどうすればよいですか? 私はそれを行う方法の例を見つけることができません。

これは現在のコードです(例から) im使用していますが、hocrファイルを出力するにはどうすればよいですか?