0

量子化された Mobilenet-SSD V2 モデルを再トレーニングしたいので、COCO からラベルのないフォルダーをダウンロードしました。このモデルには 300x300 の入力サイズが必要ですが、別のサイズの写真で一度再トレーニングするとうまくいきました (うまくいきませんでしたが、うまくいきました)。また、再トレーニングされたモデルを使用するコードは、カメラからの入力を 500x500 にサイズ変更し、機能します。私の質問は、他のサイズでも機能するのに、必要な入力が 300x300 であると書かれているのはなぜですか? ラベルを付ける前に、すべてのデータセットのサイズを 300x300 に変更する必要がありますか? 入力で畳み込みを行うことはわかっているので、サイズは本当に重要ではないと思います(間違っている場合は修正してください)。私が知っているように、畳み込みは入力の最後に到達するまで発生します。

助けてくれてありがとう!

4

1 に答える 1

3

私の理解が正しければ、あなたは TF Object Detection API を使用しています。特定のモデル (mobilenet-v2-ssd) には、3 つのメイン ブロックが含まれています。

彼らが必要な入力について話すとき、それは検出器のためです.チェックポイント自体には完全なパイプラインが含まれています。つまり、前処理ユニットが作業を行うため、事前にサイズを 300x300 に変更する必要はありません。

なんらかの理由で入力を自分で検出器に直接注入する場合は、トレーニングで行われたのと同じ前処理を行う必要があります。

ところで: トレーニングの構成ファイル ( https://github.com/tensorflow/models/blob/master/research/object_detection/samples/configs/ssd_mobilenet_v2_coco.config ) で、定義されたサイズ変更を確認できます: image_resizer { fixed_shape_resizer { 高さ: 300 幅: 300 } } - 正規化は mobilenet の正規化です (入力のダイナミック レンジを [0,255] から [-1,1] に変更します)。

于 2020-04-13T09:25:25.377 に答える