0

私はいくつかの単純なコンピューター ビジョン アルゴリズムを自分自身に教えようとしており、ノイズで破損した画像があるという問題を解決しようとしています。現在、背景の RGB チャンネルは、ノイズが含まれている可能性があるため、すべてが完全にゼロというわけではありません。ただし、人間の目は前景と背景を簡単に区別できます。

そこで、SLIC アルゴリズムを使用して画像をスーパー ピクセルに分解しました。画像はノイズで破損しているため、パッチで統計を行うと、SNR が高くなるため、背景と前景の分類が向上する可能性があるという考えです。

この後、同様のプロファイルを持つはずの約 100 個のパッチを取得し、SLIC の結果は妥当と思われます。私はグラフ カット (コルモゴロフの論文) について読んでいて、私が抱えている 2 項問題を解決するのに何か良い方法があるように思えました。そこで、一次MRFであるグラフを作成し、すぐ隣同士の間にエッジがあります(4連結グラフ)。

ここで、セグメンテーションを行うためにここで使用できる単項および 2 項の用語を考えていました。したがって、私は単項項について考えていました。背景の平均強度がゼロで、前景の平均がゼロでない単純なガウスとしてモデル化できます。ただし、これをエンコードする方法を理解するのに苦労しています。いくつかのノイズ分散を想定し、パッチ統計を使用して確率を直接計算する必要がありますか?

同様に、隣接するパッチについても、同様のラベルを使用するよう奨励したいのですが、それを反映するように設計できる 2 項用語がわかりません。ラベル(1または0)の違いだけが奇妙に思えます...

長文の質問で申し訳ありません。誰かが開始方法について役立つヒントを提供してくれることを願っています。

4

1 に答える 1