問題タブ [pytesser]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Pytesseract による OCR 精度の向上
の画像からテキストを抽出したいpython
。そのために、私は を選びましpytesseract
た。画像からテキストを抽出しようとしたところ、満足のいく結果が得られませんでした。私もこれを経験し、リストされているすべてのテクニックを実装しました。とはいえ、うまく機能していないようです。
画像:
コード:
出力:
不要なスペースが 1 つでも多くの費用がかかる可能性があります。結果が 100% 正確であることを望みます。どんな助けでも大歓迎です。ありがとう!
python - pytesseract テーブルの境界線をできるだけ繊細に消去する
pytesseract と opencv を使用して画像の境界を消去しています。tesseractを使用して画像からテキストを抽出する
この記事を参考に書いたソースコードです。 プログラムで画像内のすべての行と境界線を削除する(テキストを保持する)方法は何ですか?
画質が悪いので、表の縦線が途切れています。この破線を消すには、さらにどのような作業を行う必要がありますか? 画像の取り込みでdpiを上げたり、写真のサイズを大きくしても、縦線の破線は消えません。
ocr - 未知の指向のテキスト認識タスクにpytesseractを使用するには?
pytesseract を使用してこの画像からテキストを検出して認識したいのですが、最新の pytesseract 0.3.8 では、この画像の空の出力が得られます。これの理由は、画像内の国民 ID カードが傾いているためだと思います (非水平テキストが表示されます)。 pytesseractを使用してこの画像から国民IDカードを回転およびトリミングする方法はありますか?またはpytesseractが画像から湾曲したまたは未知の方向のテキストを自動的に認識することは可能ですか? この投稿で説明されているコードを試しました: OCR の Tesseract 自動テキスト回転機能を強化するには?
ここに私が試したコードがあります:
実際には画像全体を回転させ、画像内の NID カードを回転させることはできないため、間違った出力は次のようになります。
NIDカードにあるすべての英語のテキストを認識したいのですが、それが不可能な場合は、少なくともpytesseractを使用して、このような未知の方向の画像のNID番号を注意深く認識したいのですが、paddleocrとeasyocrがこのような画像で機能することは知っていますが、このような画像に対して pytesseract のテキスト認識を機能させることができるかどうか知りたいですか?もしそうなら、どうすればできますか? たとえば、この画像からすべての単語を認識できますか : バングラ、英語、英語の数字