1

Opencv で、BackgroundSubtractorGMG は、A. Godbehere、A. Matsukawa、K. Goldberg、American Control Conference、モントリオール、2012 年 6 月の記事「Visual Tracking of Human Visitor under Variable-Lighting Conditions for a Responsive Audio Art Installation」から来ていることを読みました。 .

それを読んでから、OpenCv のソース コードを調べました。

「Ⅲ.MULTIPLE VISITOR TRACKING」の記事 (カルマン フィルター)。
さらに、前景としてラベル付けされたものも含めて、すべてのピクセルが更新されているように見えました (記事に記載されているものとは異なります)。
もしそうなら、その実装は OpenCv の他のメソッドと同じですが、過去のピクセルのメモリを格納する方法が少し異なります。
私はどこか間違っていますか?

編集
私が注意深く読んだ元の記事には、アルゴリズムがどのように機能するかを説明する図があります。(記事は明らかです。私の疑問はOpenCvの実装についてでした)

図 1.
画像 & (前の画像 + 前景ピクセル) => セグメンテーション部分 => マルチトラッキング部分 => 前景ピクセル

オリジナルのアルゴリズムと他のアルゴリズムの特徴は、埋め込まれたマルチトラッキング部分だけです。必要に応じて削除できますが、もはや意味がありません。とにかく、統合されているため、最初の部分も変更せずにその部分を実装することはできません (これは本当に難しいはずです)。

4

1 に答える 1

1

BackgroundSubtractorGMG はトラッキングを実装しておらず、フォアグラウンド検出のみを実装しています。したがって、オブジェクト追跡は、前景検出に加えて別の操作です。OpenCVのカルマン フィルター クラスを使用して、論文の追跡部分を自分で実装できます。

フォアグラウンドセグメンテーションとオブジェクト トラッキングは、この論文で提案されているアルゴリズムの 2 つの異なるステップであり、フォアグラウンド セグメンテーションは、図 1 に示されているアルゴリズム図の一部にすぎません。記事から (強調は私のものです):

要約— 天窓のあるアトリウムでのレスポンシブ オーディオ アートのインスタレーションでは、単一カメラの統計セグメンテーションと追跡アルゴリズムを導入します。このアルゴリズムは、統計的な背景画像の推定、ピクセルごとのベイジアン セグメンテーション、および一連のカルマン フィルターとゲイル シャプレー マッチングを使用したマルチターゲット追跡問題の近似解法を組み合わせたものです。

...

III. 複数の訪問者の追跡

カメラのキャリブレーションが欠けているため、前景の訪問者をグラウンド プレーンではなくイメージ プレーンで追跡します。 フォアグラウンド/バックグラウンド セグメンテーション アルゴリズムが検出された訪問者のセットを返すと、訪問者を追跡して有用な状態情報 (画像平面内の位置、速度、サイズ) を収集することが課題になります。

...

この線形モデルが与えられ、観測がトラックに正しく一致していると仮定すると、カルマン フィルター バンクは複数ターゲット追跡問題を解決します

BackgroundSubtractorGMG検出された一連の訪問者を返すフォアグラウンド/バックグラウンド セグメンテーション アルゴリズムも同様です。これは、統計的な背景画像の推定、ピクセルごとのベイジアン セグメンテーションで構成されます。

論文のパート III では、前景オブジェクトがセグメント化された後の追跡に焦点を当てています。これは、一連のカルマン フィルターとゲイル シャプレー マッチングを使用して、複数ターゲット追跡問題の近似解を利用します。

于 2013-09-17T16:35:14.463 に答える