問題タブ [python-tesseract]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
708 参照

c++ - Finding the bounding box of the glyph in tesseract

I was going through the c++ API part of tesseract and found this snippet of code for getting each symbol from a text.

Now if we give the wrong dimensions for this bounding box(api->setRectangle) it doesn't give you the required text. So is there a way to estimate these dimensions in tesseract. Link to the source https://code.google.com/p/tesseract-ocr/wiki/APIExample#Example_of_iterator_over_the_classifier_choices_for_a_single_sym

0 投票する
1 に答える
4870 参照

python - tesseract-ocr パッケージのインストールで問題が発生しました - 「/tmp/pip_build_root/tesseract-ocr でコンパイルがエラー コード 1 で失敗しました」

pytesseract で使用する tesseract-ocr パッケージをインストールしようとすると、奇妙な問題が発生します。pip を使用して他のすべてをインストールすることはできましたが、こちらsudo pip install tesseract-ocrの指示に従って試してみると、次のエラーが表示されます。

トレースバックが UnicodeDecodeError を引き起こしているような気がします。これを解決する方法について誰かアイデアがありますか?

0 投票する
0 に答える
1020 参照

python - pytesseract OCRエラー

pytesseract画像からテキストを取得するために使用しています。しかし、私はこのエラーが発生しています。

これは私のソースファイルです。にdirは画像が含まれています

このエラーが発生しています

このエラーを取り除くには?

0 投票する
1 に答える
28961 参照

python - pytesseract は指定されたファイルを見つけることができません

私のコードは簡単で、次のとおりです。

私が返すエラー応答は次のとおりです。

どんなガイダンスも素晴らしいでしょう。

tesseract をパス変数に追加すると、次のようになりました。 C:\Program Files (x86)\Tesseract-OCR

しかし、pytesseract ピースを実行しようとすると、コードがクラッシュするようになりました。

0 投票する
3 に答える
12905 参照

tesseract - python-tesseract を使用して Hocr 出力を取得する方法

私は pytesseract を使用して本当に良い結果を得ていましたが、ダブルスペースを保持することができず、それらは私にとって本当に重要です. そこで、純粋なテキストではなく hocr 出力を取得することにしました。しかし、pytessearct を使用して構成ファイルを指定する方法はないようです。

それで、pytesseractを使用して構成ファイルを指定することは可能ですか、それともhocr出力を得るために変更できるデフォルトの構成ファイルがありますか?

0 投票する
2 に答える
11648 参照

python - Python の Tesseract OCR での UnicodeDecodeError

Python で Tesseract OCR を使用して画像ファイルからテキストを抽出しようとしていますが、対処方法を理解できるというエラーに直面しています。Pythonのocrでサンプル画像をテストしたので、私の環境はすべて良好です!

ここにコードがあります

以下は、Eclipseコンソールから取得したエラーです

Windows10でpython 3.5 x64を 使用しています

0 投票する
1 に答える
522 参照

php - Python / PHP Tesseract 出力最適化のヒント

レシートをスキャンしてスキャンしたファイルに出力する Python スクリプトがあります。新しいファイルで、tesseract imagefile outputfile を使用します。読みやすいテキストを取得できますが、解析は次のように表示されます。tesseractを使って購入した商品を価格の横に並べる方法はありますか? 私の好みは、PHP または Python で行うことです。

0 投票する
0 に答える
303 参照

python - Windows Python での Tesseract OCR

pytesseract画像に含まれる文字列を読み取れるように、Tesseract OCR エンジンとクライアント ライブラリをインストールしました。どちらの方法でケーキを切っても、次のエラーが発生します。何か案は?

0 投票する
4 に答える
8704 参照

python - tesseract-ocr のインストール時の gcc エラー

Macで次のコードを実行しようとしています。

ここからの質問に続いて: pytesseract-no such file or directory error I need to install tesseract-ocr

しかし、pip install tesseract-ocr を実行しようとすると、次のエラーが発生します。

どうすればいいのかわからない。