問題タブ [resnet]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
tensorflow - 事前トレーニング済みモデル (Keras、Tensorflow) を使用したマスク R-CNN、高速 R-CNN の最適な画像サイズ
多くの既存の Tensorflow および Keras CNN コード例では、トレーニング イメージに同じサイズ (多くの場合、299*299、244*244、256*256 など) を使用しています。これは、事前にトレーニングされたモデルとの互換性と、アーキテクチャ自体に部分的に依存していると思います。
私はまだアーキテクチャを評価していますが、Resnet、Inception または Xception、および Tensorflow または Keras を使用して、Mask R-CNN (またはおそらく Faster R-CNN) になる可能性があります。分析対象の画像は 1024*1024 の範囲ですが、より小さなパーティションに分割できます。
利用可能な事前トレーニング済みのモデルを考えると、何らかの利点をもたらすトレーニング画像サイズはありますか? 場合によっては画像の鮮明度が低下するため、後でサイズを変更する必要は避けたいと思います。