PIL、OpenCV、および OCR リーダーを使用して、画像からテキストを読み取っていました。私が直面した最大の問題は、OCR リーダーによる簡単かつ正確な抽出のためにテキストを鮮明にするための画像処理に関してです。
そのために、コントラスト/明るさを上げて、PIL を使用してヒストグラムの均等化を行うことを考えましたが、それも原因を解決しませんでした。
では、より良いテキスト抽出のためにテキストをよりシャープに見せるために何をすることをお勧めしますか?
PIL、OpenCV、および OCR リーダーを使用して、画像からテキストを読み取っていました。私が直面した最大の問題は、OCR リーダーによる簡単かつ正確な抽出のためにテキストを鮮明にするための画像処理に関してです。
そのために、コントラスト/明るさを上げて、PIL を使用してヒストグラムの均等化を行うことを考えましたが、それも原因を解決しませんでした。
では、より良いテキスト抽出のためにテキストをよりシャープに見せるために何をすることをお勧めしますか?
PIL には、シャープ化フィルタとエッジ強調フィルタがあります。これは、あなたの望むことですか?あなたが扱っているものを示す例の画像が役に立ちます。
画像の背景色が不均一で、問題が発生している可能性があります。このソリューションを見て、きれいな平準化された白黒画像を作成してみてください。
しかし、黒い襟も問題を引き起こすので、トリミングする方法を検討する必要があります.
そうは言っても、単純な PIL SHARPEN フィルターを使用すると、合理的な改善が得られます。
SHARPEN フィルター後の tesseract の結果:
私が人々の内部を調べて学んだことから、人間は「ハリケーンと角氷の間のどこかにある」と判断しました} いくつかの点では永久に神秘的ですが、他の点では - 十分な科学と慎重な調査により、完全に「綿密な調査」を行うことができます。私たちが人間の知識の限界に達したと考えるのは、すべてを知ることができると考えるのと同じくらい愚かです。より良くなり、死んだ人でさえ質問し、私たちの単純な確信がいつ間違っているかを知ることから学ぶには、まだ十分な余地があります.
フィルターなしの結果:
私が学んだことから エル。.ywr-a' は
between a luurrlctuvr null llva la
すべてです。を。I ll respects, permanently unyst:-rwnt
Ml ln ミリ秒。十分なスカエナを持っていることを確認してください) と turutul pmlulng l~m.rely 精査可能です. 私たちがすべてを知ることができると考えるのと同じように、私たちが人間の知識の限界に達したことに感謝することは、ロオールスラとしてのことです。私たちの単純な確信が間違っているとき、それを知っている人から学ぶために、死者でさえも質問するために、より良くなる余地はまだ十分にあります。