これがYOLOのアーキテクチャです。各レイヤーの出力サイズを自分で計算しようとしていますが、論文に記載されているサイズを取得できません。
たとえば、最初の Conv Layer では、入力サイズは 448x448 ですが、ストライド 2 の 7x7 フィルターを使用しますが、この式によるとW2=(W1−F+2P)/S+1 = (448 - 7 + 0) /2 + 1、整数の結果が得られないため、フィルター サイズが入力サイズに適合していないようです。
誰でもこの問題を説明できますか?YOLO アーキテクチャを見逃したり、誤解したりしましたか?