多くの既存の Tensorflow および Keras CNN コード例では、トレーニング イメージに同じサイズ (多くの場合、299*299、244*244、256*256 など) を使用しています。これは、事前にトレーニングされたモデルとの互換性と、アーキテクチャ自体に部分的に依存していると思います。
私はまだアーキテクチャを評価していますが、Resnet、Inception または Xception、および Tensorflow または Keras を使用して、Mask R-CNN (またはおそらく Faster R-CNN) になる可能性があります。分析対象の画像は 1024*1024 の範囲ですが、より小さなパーティションに分割できます。
利用可能な事前トレーニング済みのモデルを考えると、何らかの利点をもたらすトレーニング画像サイズはありますか? 場合によっては画像の鮮明度が低下するため、後でサイズを変更する必要は避けたいと思います。