私の理解では、アンカー ボックス (Yolo v2 アルゴリズム) の動機は、Yolo の最初のバージョン (Yolo v1) では、同じグリッド ボックス内で複数のオブジェクトを検出できないことです。なぜそうなのかわかりません。
また、著者による元の論文 (Yolo v1) には、次の引用があります。
「各グリッド セルは、B 境界ボックスとそれらのボックスの信頼スコアを予測します。これらの信頼スコアは、モデルがボックスにオブジェクトが含まれていることの信頼度と、ボックスが予測する正確さを反映しています。」
これは、グリッド セルが複数のオブジェクトを認識できることを示しているのではないでしょうか。彼らの論文では、彼らは B を 2 としています。なぜ B を 10 などの任意のより大きな数とみなさないのでしょうか?
2 番目の質問: 特定のオブジェクトを検出するために、アンカー ボックスの寸法はバウンディング ボックスの寸法にどのように関連付けられていますか? アンカー ボックスは形状のみを定義すると言う Web サイトもあれば、形状とサイズを定義すると言う Web サイトもあります。どちらの場合も、アンカー ボックスはバウンディング ボックスにどのように関連付けられているのでしょうか?
ありがとう、サンディープ