問題タブ [python-tesseract]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
tesseract - python-tesseractでtessedit_write_imagesを設定するには?
設定しようとしてtessedit_write_images
いますが、できないようです。どこにもtessinput.tifが表示されません
私がやっている:
しかし、「True」、「1」、およびその他のバリエーションを試してみましたが、まったく機能しないようです。
何か助けはありますか?
python - テーブルから値を読み取るtesseract
私の質問は、OCR を使用して画像内のテーブルからデータを抽出することに関するこの投稿に続きます。
tesseract
テーブル画像をテキストに変換するために使用しています。これは、テーブルの形式が保持されないことを除けば、うまく機能します。解決策の 1 つは、列をいくつかの文字で置き換えて、tesseract
それをだましてテーブルをテキストとして認識させることです。
次のコードを使用して、「QQ」の列を描画します
問題は、tesseract が QQ を認識していることです。空白のページにもQQ列を書きますが、tesseractはそれを認識しませんでした。
tesseract を使用して、このテーブルを png 形式のテキストに変換する方法はありますか? 私を逃したものはありますか?
python - Linux システムへの Python-Tesseract のインストール
Linux システムに python-tesseract をインストールできません。私はこのチュートリアルを使用しています: http://delimitry.blogspot.be/2014/10/installing-tesseract-for-python-on.html
私が得るエラーは次のとおりです。
残りの手順を順番に実行python setup.py clean
した/python-tesseract
後、実行する場合。
このシステムで linux 3.2.0-4-amd64 を実行しています。
Whereis tesseract-ocr
戻り値:
Whereis leptonica
戻り値:
Whereis tesseract
戻り値:
また、他のいくつかのチュートリアル/ガイドを実行して python-tesseract をインストールしようとしましたが、libleptonica が見つからない、libc6 が見つからないなどの他のエラーが返されましたが、これらをあまり調査していません。他のガイドがすぐに機能するかどうかを確認しようとしました. また、ターミナルで tesseract を実行すると機能しますが、インポート tesseract は機能しません。
私は何を間違っていますか?これを修正して python-tesseract をインストールするにはどうすればよいですか?
python-2.7 - pytesseractでキャラクターの位置を取得する方法
pytesseract ライブラリを使用して画像ファイルの文字位置を取得しようとしています。
文字の各位置を取得するためのライブラリはありますか
python - Tesseract-OCR を使用した画像からテキストへの認識は、Python コードよりも Gimp を使用して画像を手動で前処理した場合に優れています
Tesseract-OCR を使用した手動の画像前処理と認識のために、Python でコードを記述しようとしています。
手動プロセス:
単一の画像のテキストを手動で認識するために、Gimp を使用して画像を前処理し、TIF 画像を作成します。次に、それを正しく認識する Tesseract-OCR にフィードします。
Gimpを使用して画像を前処理するには -
- モードを RGB / グレースケールに変更
メニュー -- イメージ -- モード -- RGB - しきい値設定
メニュー -- ツール -- カラー ツール -- しきい値 -- 自動 - モードを Indexed
Menu -- Image -- Mode -- Indexedに変更します - Resize / Scale to Width > 300px
Menu -- Image -- Scale image -- Width=300 - Tif として保存
それから私はそれにtesseractを与えます -
そして、常に正確な結果が得られます。
Python コード:
OpenCV と Tesseract を使用して上記の手順を複製しようとしました -
しかし、私は同じ精度を得ていません。私は何を取りこぼしたか?
更新 1:
更新 2:
このコードは、https://github.com/hussaintamboli/python-image-to-textで入手できます。
python - Python tesseractで初期化のみのパラメータを設定するには?
python-tesseract ラッパーを使用していくつかの Tesseract パラメータを設定しようとしていますが、Init Onlyパラメータの場合は設定できません。
私は Tesseract のドキュメントを読んできましたが、これらを設定するには Init() を使用する必要があるようです。これらは setVariable ドキュメントがそれについて述べていることです:
init 以外の変数に対してのみ機能します * (init 変数は Init() に渡す必要があります)。
したがって、Init() 関数には次のシグネチャがあります。
私のコードは次のとおりです。
問題は、次のエラーが表示されることです。
そして、問題はこれらの GenericVectors に関連しています。代わりにこの行を使用する場合:
できます。したがって、問題はこれらの GenericVectors です。正しいパラメータを Init() に渡すにはどうすればよいですか?
コードで初期化のみのパラメーターを設定する他の方法はありますか? これらのパラメーターを使用して、コードから構成ファイルをロードできますか?
お時間をいただきありがとうございます。
python-3.x - Pytesseract: UnicodeDecodeError: 'charmap' コーデックはバイトをデコードできません
Pytesseract を使用して、スクリーンショットで多数の OCR を実行しています。ほとんどの場合、これで問題なく動作しますが、一部のユーザーがこのエラーを引き起こしています。
Python 3.4 を使用しています。このエラーの発生を防ぐ方法 (try/except 以外の方法) があれば、非常に役立ちます。