ウェブカメラ画像の動きを識別するアプリケーションがあります。次のようなものが生成されます...
黒の領域は動きを示します。これは主にピクセルごとに行われます(ただし、近くのピクセルは考慮されます)
だから...各ピクセルの動きがtrue/falseになったので、その情報を使用してオブジェクトの輪郭を識別する必要があります。
欲しいのは次のようなものです。
アウトラインは正確である必要はなく、バウンディングボックスを受け入れることができます。両方を組み合わせて表示すると、より目立つノイズの領域もいくつかあります...
ご覧のとおり、オブジェクトの外側にいくつかの「動き」ピクセルがあります。おそらく、オブジェクトの最小領域を指定することで、これらを排除します。
したがって、オブジェクトのエッジを識別するためのアルゴリズムは何ですか。理想的には、この情報を使用して、各オブジェクトのおおよその中心を計算できるようになります。
注:@mmgpで説明されているように、上の画像は白黒のものも含めてすべてフルRGBです。これは、エクスポート用の画像を生成する方法によるものです。内部的には、ビット配列です。