問題タブ [python-tesseract]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c++ - Finding the bounding box of the glyph in tesseract
I was going through the c++ API part of tesseract and found this snippet of code for getting each symbol from a text.
Now if we give the wrong dimensions for this bounding box(api->setRectangle
) it doesn't give you the required text. So is there a way to estimate these dimensions in tesseract.
Link to the source https://code.google.com/p/tesseract-ocr/wiki/APIExample#Example_of_iterator_over_the_classifier_choices_for_a_single_sym
python - tesseract-ocr パッケージのインストールで問題が発生しました - 「/tmp/pip_build_root/tesseract-ocr でコンパイルがエラー コード 1 で失敗しました」
pytesseract で使用する tesseract-ocr パッケージをインストールしようとすると、奇妙な問題が発生します。pip を使用して他のすべてをインストールすることはできましたが、こちらsudo pip install tesseract-ocr
の指示に従って試してみると、次のエラーが表示されます。
トレースバックが UnicodeDecodeError を引き起こしているような気がします。これを解決する方法について誰かアイデアがありますか?
python - pytesseract OCRエラー
pytesseract
画像からテキストを取得するために使用しています。しかし、私はこのエラーが発生しています。
これは私のソースファイルです。にdir
は画像が含まれています
このエラーが発生しています
このエラーを取り除くには?
python - pytesseract は指定されたファイルを見つけることができません
私のコードは簡単で、次のとおりです。
私が返すエラー応答は次のとおりです。
どんなガイダンスも素晴らしいでしょう。
tesseract をパス変数に追加すると、次のようになりました。
C:\Program Files (x86)\Tesseract-OCR
しかし、pytesseract ピースを実行しようとすると、コードがクラッシュするようになりました。
tesseract - python-tesseract を使用して Hocr 出力を取得する方法
私は pytesseract を使用して本当に良い結果を得ていましたが、ダブルスペースを保持することができず、それらは私にとって本当に重要です. そこで、純粋なテキストではなく hocr 出力を取得することにしました。しかし、pytessearct を使用して構成ファイルを指定する方法はないようです。
それで、pytesseractを使用して構成ファイルを指定することは可能ですか、それともhocr出力を得るために変更できるデフォルトの構成ファイルがありますか?
python - Python の Tesseract OCR での UnicodeDecodeError
Python で Tesseract OCR を使用して画像ファイルからテキストを抽出しようとしていますが、対処方法を理解できるというエラーに直面しています。Pythonのocrでサンプル画像をテストしたので、私の環境はすべて良好です!
ここにコードがあります
以下は、Eclipseコンソールから取得したエラーです
Windows10でpython 3.5 x64を 使用しています
php - Python / PHP Tesseract 出力最適化のヒント
レシートをスキャンしてスキャンしたファイルに出力する Python スクリプトがあります。新しいファイルで、tesseract imagefile outputfile を使用します。読みやすいテキストを取得できますが、解析は次のように表示されます。tesseractを使って購入した商品を価格の横に並べる方法はありますか? 私の好みは、PHP または Python で行うことです。
python - Windows Python での Tesseract OCR
pytesseract
画像に含まれる文字列を読み取れるように、Tesseract OCR エンジンとクライアント ライブラリをインストールしました。どちらの方法でケーキを切っても、次のエラーが発生します。何か案は?
python - tesseract-ocr のインストール時の gcc エラー
Macで次のコードを実行しようとしています。
ここからの質問に続いて: pytesseract-no such file or directory error I need to install tesseract-ocr
しかし、pip install tesseract-ocr を実行しようとすると、次のエラーが発生します。
どうすればいいのかわからない。