問題タブ [pytesser]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
573 参照

python - pytesserでtesseractを実行するときにコンソールウィンドウを非表示にするにはどうすればよいですか

私はPythonが初めてです。私はOCRプロジェクトに取り組んでいます。Windows 7 で Python 2.7.12 を使用しています。パス「C:\Program Files (x86)\Tesseract-OCR」に tesseract をインストールしました。

ここで pytesser ライブラリ v0.0.2 を見つけました: https://searchcode.com/codesearch/view/11386640/#

コードを実行すると:

tesseract を呼び出し、tesseract.exe ウィンドウが表示されます (画像を参照してください: https://www.dropbox.com/s/p0i6sjj61yhfnp9/question.png?dl=0 )。非表示にしたいのですが、方法がわかりません。ライブラリファイルの何かを変更する必要があると思います。誰か助けてください。

0 投票する
2 に答える
18891 参照

python - 画像からテキストを読み取る

これらの画像をテキストに変換するための提案はありますか? 私は pytesseract を使用していますが、これを除いてほとんどの場合、うまく機能しています。理想的には、これらの数字を正確に読みたいと思います。最悪の場合、PIL を使用して「/」の左側の数字がゼロかどうかを判断することもできます。左から始めて最初の白いピクセルを見つけ、次に

ここに画像の説明を入力 ここに画像の説明を入力

真ん中のスラッシュはここで問題を引き起こします。また、PIL の「.paste」を使用して、画像の周りに余分な黒を追加しようとしました。私が試すことができる PIL トリックは他にもいくつかあるかもしれませんが、必要がない限り、そのルートには行きたくありません。

config='-psm 10' を使用してみましたが、8 が ":" として表示されることもあれば、ランダムな文字が表示されることもありました。そして、私の0は何もないものとして通り抜けていました。

参照先: pytesseract は-psm 10 の1 桁の画像では機能しません

______________EDIT________________ 追加のサンプル:

ここに画像の説明を入力 1BJ2I]

ここに画像の説明を入力 DIS

ここに画像の説明を入力 10.I'10

ここに画像の説明を入力 20.I20

だから私は今のところうまくいっているように見えるいくつかのブードゥー変換を行っています. しかし、非常にエラーが発生しやすいように見えます:

最終的に生成されるもの:

0 投票する
1 に答える
10217 参照

python - OCR: 画像からテキストを抽出

画像からテキストを抽出するプログラムに取り組んでいます。そのためにライブラリを試してみたところ、Tessaract単純Ocropusなプレーンテキスト(単純なフォントの白黒)を画像からテキスト文字列に変換できました。例えば:

画像例1

しかし、複雑な画像からテキストを抽出することはできません。たとえば、この画像から次のように言いましょう。

画像例2

これを達成する方法を知っている人はいますか?複雑な画像からテキストを抽出するために利用できるライブラリはありますか (予測できないさまざまな背景がありますか?私は Python を好みますが、言語はバーではありません。

0 投票する
3 に答える
3111 参照

python-3.x - pytesseract使用時のpython FileNotFoundError

画面上の数字を検出するために現在の画面の一部をキャプチャしようとしましたが、コードを実行すると次のエラーが発生しました。

ソースコード:

理由と修正方法を教えてください。

0 投票する
1 に答える
562 参照

opencv - 車両に書かれたテキストのOCRを改善するには?

電車やトラックなどの車両のOCRを行って、それらに書かれた数字や文字を識別しようとしています。(これはナンバー プレート識別 OCR ではないことに注意してください)

この画像を撮りました。アイデアは、テキストを抽出できるようにすることです-それに書かれたBN SF 721 734。

ここに画像の説明を入力

前処理として、まずこの画像をグレースケールに変換してから、次のような 2 値化画像に変換しました。

ここに画像の説明を入力

私はtesseractでいくつかのコードを書きました。

このコードにより、信頼値 95 の空白の出力が得られました。これは、この画像にテキストが存在しないことを tesseract が 95% 信頼していたことを意味します。

次に、Tesseract の setrectangle API を使用して、画像全体で OCR を実行するのではなく、画像内の特定のウィンドウで OCR を制限しました。

座標 665、445、75、および 40 は、画像内のテキスト BNSF 721 734 を含む長方形に対応します。665 - 上、445 - 左、75 - 幅、40 - 高さ。

私が得た出力はこれでした:

私の質問は、どうすれば結果を改善できますか? setrectangle 関数の値をいじってみましたが、結果は少し異なりましたが、どれも同じように悪いものでした。

これを改善する方法はありますか?

画像を 2 値化した画像に変換する方法に興味がある場合は、OpenCV を使用しました