問題タブ [python-tesseract]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
2689 参照

tesseract - python-tesseractでtessedit_write_imagesを設定するには?

設定しようとしてtessedit_write_imagesいますが、できないようです。どこにもtessinput.tifが表示されません

私がやっている:

しかし、「True」、「1」、およびその他のバリエーションを試してみましたが、まったく機能しないようです。

何か助けはありますか?

0 投票する
1 に答える
6081 参照

python - テーブルから値を読み取るtesseract

私の質問は、OCR を使用して画像内のテーブルからデータを抽出することに関するこの投稿に続きます。

tesseractテーブル画像をテキストに変換するために使用しています。これは、テーブルの形式が保持されないことを除けば、うまく機能します。解決策の 1 つは、列をいくつかの文字で置き換えて、tesseractそれをだましてテーブルをテキストとして認識させることです。

列のないテーブルの例を次に示しますここに画像の説明を入力

次のコードを使用して、「QQ」の列を描画します

次の画像が表示されます ここに画像の説明を入力

問題は、tesseract が QQ を認識していることです。空白のページにもQQ列を書きますが、tesseractはそれを認識しませんでした。

tesseract を使用して、このテーブルを png 形式のテキストに変換する方法はありますか? 私を逃したものはありますか?

0 投票する
1 に答える
3422 参照

python - Linux システムへの Python-Tesseract のインストール

Linux システムに python-tesseract をインストールできません。私はこのチュートリアルを使用しています: http://delimitry.blogspot.be/2014/10/installing-tesseract-for-python-on.html

私が得るエラーは次のとおりです。

残りの手順を順番に実行python setup.py cleanした/python-tesseract後、実行する場合。

このシステムで linux 3.2.0-4-amd64 を実行しています。

Whereis tesseract-ocr戻り値:

Whereis leptonica戻り値:

Whereis tesseract戻り値:

また、他のいくつかのチュートリアル/ガイドを実行して python-tesseract をインストールしようとしましたが、libleptonica が見つからない、libc6 が見つからないなどの他のエラーが返されましたが、これらをあまり調査していません。他のガイドがすぐに機能するかどうかを確認しようとしました. また、ターミナルで tesseract を実行すると機能しますが、インポート tesseract は機能しません。

私は何を間違っていますか?これを修正して python-tesseract をインストールするにはどうすればよいですか?

0 投票する
4 に答える
11309 参照

python-2.7 - pytesseractでキャラクターの位置を取得する方法

pytesseract ライブラリを使用して画像ファイルの文字位置を取得しようとしています。

文字の各位置を取得するためのライブラリはありますか

0 投票する
2 に答える
9463 参照

python - Tesseract-OCR を使用した画像からテキストへの認識は、Python コードよりも Gimp を使用して画像を手動で前処理した場合に優れています

Tesseract-OCR を使用した手動の画像前処理と認識のために、Python でコードを記述しようとしています。

手動プロセス:
単一の画像のテキストを手動で認識するために、Gimp を使用して画像を前処理し、TIF 画像を作成します。次に、それを正しく認識する Tesseract-OCR にフィードします。

Gimpを使用して画像を前処理するには -

  1. モードを RGB / グレースケールに変更
    メニュー -- イメージ -- モード -- RGB
  2. しきい値設定
    メニュー -- ツール -- カラー ツール -- しきい値 -- 自動
  3. モードを Indexed
    Menu -- Image -- Mode -- Indexedに変更します
  4. Resize / Scale to Width > 300px
    Menu -- Image -- Scale image -- Width=300
  5. Tif として保存

それから私はそれにtesseractを与えます -

そして、常に正確な結果が得られます。

Python コード:
OpenCV と Tesseract を使用して上記の手順を複製しようとしました -

しかし、私は同じ精度を得ていません。私は何を取りこぼしたか?

更新 1:

  1. 元の画像
    ここに画像の説明を入力
  2. Gimp を使用して作成された Tif イメージ
    ここに画像の説明を入力
  3. 私のpythonコードで作成されたTif画像
    ここに画像の説明を入力

更新 2:

このコードは、https://github.com/hussaintamboli/python-image-to-textで入手できます。

0 投票する
1 に答える
1243 参照

python - Python tesseractで初期化のみのパラメータを設定するには?

python-tesseract ラッパーを使用していくつかの Tesseract パラメータを設定しようとしていますが、Init Onlyパラメータの場合は設定できません。

私は Tesseract のドキュメントを読んできましたが、これらを設定するには Init() を使用する必要があるようです。これらは setVariable ドキュメントがそれについて述べていることです:

init 以外の変数に対してのみ機能します * (init 変数は Init() に渡す必要があります)。

したがって、Init() 関数には次のシグネチャがあります。

私のコードは次のとおりです。

問題は、次のエラーが表示されることです。

そして、問題はこれらの GenericVectors に関連しています。代わりにこの行を使用する場合:

できます。したがって、問題はこれらの GenericVectors です。正しいパラメータを Init() に渡すにはどうすればよいですか?

コードで初期化のみのパラメーターを設定する他の方法はありますか? これらのパラメーターを使用して、コードから構成ファイルをロードできますか?

お時間をいただきありがとうございます。

0 投票する
2 に答える
4588 参照

python-3.x - Pytesseract: UnicodeDecodeError: 'charmap' コーデックはバイトをデコードできません

Pytesseract を使用して、スクリーンショットで多数の OCR を実行しています。ほとんどの場合、これで問題なく動作しますが、一部のユーザーがこのエラーを引き起こしています。

Python 3.4 を使用しています。このエラーの発生を防ぐ方法 (try/except 以外の方法) があれば、非常に役立ちます。