画像検出アプリケーションには CONV-maxpool-CONV-maxpool-CONV-maxpool-CONV-maxpool-hidden-logistic アーキテクチャを使用します。ただし、ほとんどの例では、画像の強度を [0,1] の範囲に正規化しています。しかし、入力の平均がゼロではないため、良くないようです。それは白化された入力ではありません。[-0.5,0.5] 入力範囲を使用する試みはありますか?
質問する
734 次
1 に答える
0
私は、多くの論文が Global Constrast Normalization を使用しているのを見てきました。これは、データのゼロセンタリングと、特徴が単位分散を持つようにスケーリングすることで構成されます。これにより、画像のピクセルは、あなたが言ったように約0間隔で対称になります。さらなる「ベスト プラクティス」については、こちらの記事Best Practices for Convolutional Neural Networks Applied to Object Recognition in Images をご覧ください。
于 2016-01-06T18:53:55.930 に答える