0

テキストシートのグレースケールの写真があるとします。各紙は真っ白で、テキストは真っ黒です。

残念ながら、光は均一ではなく、遠近法シェーディングが発生し、紙が湾曲することもあります。もちろん、画像には小さな高周波ノイズがいくつかあります。

この状況でテキストと背景を分離するためのほぼ理想的なソリューションがあるはずです。

それで、それは何ですか?:)

このようなグレースケール画像をほぼ完璧な白黒画像に変換することは、不可能だとは思いませんし、難しいとも思いません。私はこれを証明することはできませんが、私は自分の認識で判断します。そのような写真を目で認識するのに知性は必要ありません。なじみのない言語でもかまいませんが、正確に何が書かれているかを確認します。

では、コンピュータに同じことを教えるにはどうすればよいでしょうか。

アップデート

元の画像を考慮する

ここに画像の説明を入力

グローバルなしきい値設定により、アーティファクト (1) および不均一なテキスト表現 (2) が発生します。

ここに画像の説明を入力

ローカル統計を検索するしきい値が必要です。

4

1 に答える 1

1

適応しきい値処理に切り替えます。

ここにいくつかの紹介があります - http://homepages.inf.ed.ac.uk/rbf/HIPR2/adpthrsh.htm

適応しきい値処理は、まさにこの種の問題に対処するように設計されています。

于 2013-06-30T09:17:47.650 に答える