画像検出アルゴリズムから結果を収集しています。つまり、基本的には、一連の画像 (320 x 480 のサイズ) から、64 x 128 のスライディング ウィンドウを実行し、いくつかの事前定義されたスケールの下で実行します。
という事は承知しています:
- 真陽性 = 検出されたウィンドウが (定義された交差サイズ/重心内で) グラウンド トゥルース (注釈付き境界ボックス) と重なっている場合
- False Positives = アルゴリズムが肯定的なウィンドウを与えたとき、それはグランド トゥルースの外側にあります。
- False Negatives = 正のウィンドウを与えることができなかったときに、グラウンド トゥルース アノテーションはオブジェクトがあると述べています。
しかし、True Negativesはどうでしょうか? これらの真陰性は、分類器が私に否定的な結果を与えるすべてのウィンドウですか? 小さなウィンドウ (64x128) を一度に 4 ピクセルずつスライドさせており、検出には約 8 つの異なるスケールを使用しているため、これは奇妙に聞こえます。もし私がそうしたら、画像ごとに多くの真のネガができてしまいます。
それとも、一連の純粋なネガティブ画像 (物体や人間はまったく存在しない) を準備し、スライドして通過するだけで、これらの各画像に 1 つ以上のポジティブな検出がある場合は、それを偽陰性としてカウントし、その逆を行いますか?逆?
これは画像の例です(緑色の四角形がグラウンドトゥルースです)