現在、私は Yolo9000 モデル「https://arxiv.org/pdf/1612.08242.pdf」を読んでおり、モデルがオブジェクト検出の境界ボックスをどのように予測できるかについて非常に混乱しています。Tensorflow で多くの例を実行しました。それらのほとんどは、モデル「画像と画像のラベル」に与えます。
私の質問は次のとおりです。1-ラベルの代わりにバウンディングボックスをモデルに渡すにはどうすればよいですか? 2- モデルは、多くのボックスが 1 つの画像に属していることをどのように学習できますか?