問題タブ [yolo]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
computer-vision - Yolo オブジェクト検出アルゴリズムに関する概念的な質問
私の理解では、アンカー ボックス (Yolo v2 アルゴリズム) の動機は、Yolo の最初のバージョン (Yolo v1) では、同じグリッド ボックス内で複数のオブジェクトを検出できないことです。なぜそうなのかわかりません。
また、著者による元の論文 (Yolo v1) には、次の引用があります。
「各グリッド セルは、B 境界ボックスとそれらのボックスの信頼スコアを予測します。これらの信頼スコアは、モデルがボックスにオブジェクトが含まれていることの信頼度と、ボックスが予測する正確さを反映しています。」
これは、グリッド セルが複数のオブジェクトを認識できることを示しているのではないでしょうか。彼らの論文では、彼らは B を 2 としています。なぜ B を 10 などの任意のより大きな数とみなさないのでしょうか?
2 番目の質問: 特定のオブジェクトを検出するために、アンカー ボックスの寸法はバウンディング ボックスの寸法にどのように関連付けられていますか? アンカー ボックスは形状のみを定義すると言う Web サイトもあれば、形状とサイズを定義すると言う Web サイトもあります。どちらの場合も、アンカー ボックスはバウンディング ボックスにどのように関連付けられているのでしょうか?
ありがとう、サンディープ