ビデオからブロブ抽出を実行し、ブロブのアスペクト比を使用して人間または車両に分類しています。車両と人間は縦横比がかなり異なるため、かなりうまく機能します。
ただし、このロジックは、人間のグループ (たとえば、母親と子供が手をつないでいる、または近くを歩いているグループ) が近づいてきて、ブロブ検出が 1 つのブロブである場合に破綻します。
画像をセグメント化するための最良のアプローチは何だろうと思っています。理想的には、グループ内の人間も数えたいと思います。
ここにいくつかの考えがあります:
- canny -> 輪郭 -> Hu Moments シェイプ マッチングを使用してさまざまなサイズの輪郭を試しますか? 問題は、このグループに何人の人間がいる可能性があるか分からないことです
- canny->contour> 人間の輪郭のテンプレートを使用したテンプレート マッチング。これは、一般的なスケールの不変性を考えるとうまくいくかもしれません。
これにどのようにアプローチすべきかについて他に考えはありますか?すべての提案と入力に感謝します/