テキストシートのグレースケールの写真があるとします。各紙は真っ白で、テキストは真っ黒です。
残念ながら、光は均一ではなく、遠近法シェーディングが発生し、紙が湾曲することもあります。もちろん、画像には小さな高周波ノイズがいくつかあります。
この状況でテキストと背景を分離するためのほぼ理想的なソリューションがあるはずです。
それで、それは何ですか?:)
このようなグレースケール画像をほぼ完璧な白黒画像に変換することは、不可能だとは思いませんし、難しいとも思いません。私はこれを証明することはできませんが、私は自分の認識で判断します。そのような写真を目で認識するのに知性は必要ありません。なじみのない言語でもかまいませんが、正確に何が書かれているかを確認します。
では、コンピュータに同じことを教えるにはどうすればよいでしょうか。
アップデート
元の画像を考慮する
グローバルなしきい値設定により、アーティファクト (1) および不均一なテキスト表現 (2) が発生します。
ローカル統計を検索するしきい値が必要です。