0

この記事で説明した Push-Relabel Graph Cut アルゴリズムを前提として、バイナリ イメージ セグメンテーションを実行したいと考えています。私の質問は、グラフの初期化に関するものです。

画像を格子構造 (MRF) を持つグラフとして表す場合、通常は、この論文のセクション 3 の式 1 に従って、標準の単項項およびペアワイズ項のエネルギー関数に従って問題を定式化します。ここで、単項項はデータです。エネルギーとペアワイズ項は、ある近傍の滑らかさをモデル化します。

この MRF 最適化定式化と、リンクされた記事の max-flow アルゴリズムの定式化とを結び付けるのに苦労しています。私の理解では、隣接するノード間の容量は、このペーパーのセクション 2、方程式 7 など、(空間距離と強度の値に基づく) 距離関数で表すことができます。ただし、シード ポイントの初期分布など、事前の知識をグラフの初期化に組み込む方法は明確ではありません。

より高いレベルでは、背景またはオブジェクト クラスに関連するいくつかのラベル付きシード ポイントを含む画像が与えられた場合、max-flow を使用してバイナリ セグメンテーションを実行できるようにフロー グラフを初期化するにはどうすればよいでしょうか?

4

1 に答える 1

0

グラフにはピクセルごとに頂点がありますが、ソース頂点とシンク頂点もあり、どちらもピクセルに対応していません。これらの特別な頂点の 1 つの可能な解釈は、ソースが「前景」セグメントを表し、シンクが「背景」セグメントを表すというものです。

ソースからピクセル頂点までの円弧の容量は、そのピクセルが前景にある対数尤度です。ピクセル頂点からシンクまでの円弧の容量は、そのピクセルが背景にある対数尤度です。ピクセル頂点間の円弧の容量は、ピクセルが両方とも前景にあるか、両方とも背景にある対数尤度を表します。この信頼度は、ピクセルが互いに近く、ピクセルの色が類似している場合に高くなります。

于 2016-06-09T14:15:48.160 に答える