問題タブ [pytesser]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
2232 参照

python - pytesser で単純な数字を認識する

PyTesserと を使ってOCRを学んでいTesseractます。最初のマイルストーンとして、数字だけで構成されるキャプチャを認識するツールを書きたいと思います。いくつかのチュートリアルを読み、そのようなテスト プログラムを作成しました。

以下の画像でコードをテストしました。しかし、結果は2(T?770. また、他の同様の画像もいくつかテストしましたが、80% の場合、結果は正しくありません。

ここに画像の説明を入力

画像処理に慣れていません。ここで 2 つの質問があります。

  1. PyTesser数字だけを推測するように言うことは可能ですか?

  2. 人間にとってとても読みやすい画像だと思います。数字のみの画像を読み取るのが非常に難しい場合PyTesser、より良い OCR を実行できる代替手段はありますか?

どんなヒントでも大歓迎です。

0 投票する
1 に答える
7454 参照

python - pytesseract が「 'str' object has no attribute 'save'」エラーを表示する

pytesseract に対して次のコードを実行すると

以下のエラーが表示されます

このエラーはどういう意味ですか? どうすればこれを修正できますか?

前もって感謝します

0 投票する
1 に答える
835 参照

python - Python 2.7.9 の Pytesser - print image_to_string(image) エラー

Python OCRにPytesserを使用しています。PIL と Pytesser をインストールし、次のコードを実行しました。

するとこんなエラーが出ます

これはどういう意味ですか?私は何を間違えましたか?Windows 8 64 ビットと Python 2.7.9 を使用しています

0 投票する
2 に答える
1277 参照

python-2.7 - pytesseract の使用エラー

pytesseract を使用して画像をテキストに変換しています。pip コマンドで pytesseract のインストールに成功しました。しかし、スクリプトを実行すると、エラーが表示されます: No module named Tesseract.

これらは私のコードです:

エラー :

0 投票する
1 に答える
1015 参照

python - pytesser subprocess.Popen 失敗

昨日から、OCR pytesser を使用しようとしています。私は自分でいくつかの問題を解決しましたが、これを乗り越える方法がわかりません。エラーがあります:

最後の行は「ファイルが見つかりません」と言っています

tesseract をinit .pyに入れる方法があります

彼がファイルを開けない理由が本当にわかりません。私のinit .pyには他にも2つあります。私が作成しようとした画像ファイルとtxtファイルを変更して、彼にパスを与えることはできませんが、彼は自分で作成したと思います。

これは Popen に送信される 3 つのファイルなので、エラーがあると思います。

皆さんが私が抱えている問題を理解するのに十分明確であることを願っています。

編集: lol.py はこのサイトからのもので、URL http://www.debasish.in/2012/01/bypass-captcha-using-python-and.htmlを変更しただけです

0 投票する
1 に答える
3026 参照

python - pytesser - 画像内のテキストの次の行?

プレーンテキストの単純な画像で pytesser を使用しています。それはうまくいきます!ただし、Python では、テキストの各行を新しい行に出力します。しかし、それが出力する文字列には、引き出すことができる「\n」または改行区切り文字がありません。

コンソールの新しい行に画像の新しい行をどのように出力しますか? そして、特定の行を引き出す方法はありますか? またはそれらを自分で分割しますか?

それはおそらく私が見逃している非常に単純なものです...

出力:

0 投票する
1 に答える
475 参照

python - math tesseract モジュールをロードするには?

したがって、私はtesseractを初めて使用し、数学入力モジュールをロードしたいと考えています。残念ながら、このリンクにある数学モジュールでそれを使用する方法がわかりません。これを適切にロードするにはどうすればよいですか? デフォルトでトレーニング済みデータをロードしますか? トレーニング済みデータを適切な tessdata フォルダーに既に追加していますか? lang パラメータの isocode がどうあるべきかわかりませんか? マットのようなものですか?この問題に関するドキュメントは非常に限られているため、ご協力をお願いいたします。

これも pytesseract でコーディングしていますが、トレーニング済みデータセットの変更をサポートしていない場合は、他のモジュールを使用できます。

0 投票する
1 に答える
10062 参照

python - Windows で Python OCR を使い始めますか?

これまで Python を使用したことがなく、どこから始めればよいかわかりません。私の目標は、数字と多色の背景の画像データを取得し、正しい文字を確実に識別できるようにすることです。これに必要なツールを調べたところ、tesseract-ocr と pytesser だけでなく、必要になる可能性のあるすべてのパッケージが含まれている Anaconda Python ディストリビューションを見つけました。

残念ながら、私は始め方に迷っています。私は PyCharm Community IDE を使用しており 、OCR を把握するためにhttp://www.manejandodatos.es/2014/11/ocr-python-easy/のガイドに従っているだけです。

これは私が使用しているコードです:

私が使用しているAnacondaディストリビューションにはPILがあると思いますが、次のエラーが発生しています:

誰かが私を正しい方向に向けることができますか?