スキャンした画像を白黒画像に変換したいのですが、OCR のために画像をインターネット経由で転送する前にファイル サイズを小さくすることが目標です。
スキャナーや一般的な画像編集ソフトウェアで作成された通常の 2 値化/白黒画像では、望ましくない結果が生じます。
多くのランダムな黒いピクセルが残されますが、これは実際には 2 値化による単なるノイズです。これにより、OCR は、存在しない文字を認識しようとしたり、文字の後にピリオドやコロンなどを挿入したりします。
OpenCV で画像を 2 値化し、線、文字、暗い領域をソリッドに保ち、白い領域のピクセル ノイズを減らすために使用できるものは何ですか?
私は cvThreshold と cvAdaptiveThreshold をいじりましたが、結果はまだ良くありません。