オブジェクト(人間)検出のための HOG 記述子に関する理論を読んでいます。しかし、些細なことのように聞こえるかもしれませんが、実装についていくつか質問があります。
ブロックを含むウィンドウについて。次に示すように、各ステップでウィンドウが重なる位置で、ウィンドウを画像上でピクセルごとに移動する必要があります。
または、次のように、重複を引き起こさずにウィンドウを移動する必要があります。
これまで見てきたイラストは、2 番目のアプローチを使用していました。ただし、検出ウィンドウのサイズが 64x128 であることを考慮すると、ウィンドウを画像上でスライドさせても、画像全体をカバーできない可能性が高くなります。画像のサイズが 64x255 の場合、最後の 127 ピクセルはオブジェクトのチェック対象になりません。したがって、最初のアプローチはより合理的に見えますが、より多くの時間と CPU を消費します。
何か案は?前もって感謝します。
編集: Dalal と Triggs の元の論文に固執しようとしています。アルゴリズムを実装し、2 番目のアプローチを使用する 1 つの論文は、次の場所にあります。