デジタル画像処理に関する最終試験のために名刺スキャナーを使用しています。tesseract がテキストを認識できるように、名刺の写真を前処理する方法を教えてください。侵食、拡張、しきい値処理など、さまざまなことを試しましたが、良い結果が得られません...助けてもらえますか?
ありがとうございました
マルコ
デジタル画像処理に関する最終試験のために名刺スキャナーを使用しています。tesseract がテキストを認識できるように、名刺の写真を前処理する方法を教えてください。侵食、拡張、しきい値処理など、さまざまなことを試しましたが、良い結果が得られません...助けてもらえますか?
ありがとうございました
マルコ
オープン ソースの C++ 画像処理ライブラリ OpenCV とオープン ソースの無料の光学式文字認識 (OCR) ライブラリ tesseract の組み合わせをお勧めします。あなたの問題に関するあなたの情報はあまり具体的ではないので、私はあなたの質問に一般的に答えることができます.OCRの主な手順は次のとおりです.
tesseract について一言: オンラインで入手できるライブラリに関する情報はたくさんあります。これは、Google ブックスの OCR 目的で使用される Google オープン ソース ライブラリです。画像のレイアウト分析も処理できますが、これは完全ではありません。したがって、自分で前処理し、実際の文字認識部分にのみ tesseract を使用すると、より良い結果が得られます。まだ質問がある場合、または質問を誤解している場合は、お気軽に質問してください。
前処理ではなくテキスト認識のみに関心がある場合は、ScanTailorの使用を検討してください。これは優れた前処理ツールであり、オープン ソースです。
前処理を自分で実装したい場合は、このペーパー、特にスキュー補正とバックグラウンド推定をご覧になることをお勧めします。ここで説明するアルゴリズムの結果は良好です。ScanTailor はこれらのいくつかを使用します。