問題タブ [image-preprocessing]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - セマンティック セグメンテーションでは、画像の前処理とデータ拡張をどのように行うべきですか?
4116 224x224x3 (RGB) の航空写真を含む不均衡で小さなデータセットがあります。データセットが十分に大きくないため、過剰適合の問題が発生する可能性が非常に高くなります。以下で説明するように、画像の前処理とデータ拡張は、この問題に取り組むのに役立ちます。
「オーバーフィッティングは、学習するサンプルが少なすぎるために発生し、新しいデータに一般化できるモデルをトレーニングできなくなります。無限のデータが与えられると、モデルは手元のデータ分布のあらゆる可能な側面にさらされます:決してオーバーフィット データ拡張は、信頼できる画像を生成する多数のランダム変換を介してサンプルを拡張することにより、既存のトレーニング サンプルからより多くのトレーニング データを生成するアプローチを採用しています。」
Deep Learning with Python by François Chollet、ページ 138-139、5.2.5 データ拡張の使用。
Medium - Image Data Preprocessing for Neural Networksを読み、Stanford のCS230 - Data Preprocessingおよび CS231 - Data Preprocessingコースを調べました。SO questionでもう一度強調されており、「すべてに適合する」ソリューションがないことを理解しています。これが私にこの質問をさせた理由です:
「高い空間解像度を達成したいので、翻訳の増強は使用されませんでした。」
参考:Researchgate - 深層畳み込みニューラル ネットワークを使用した都市リモート センシング画像における小さなオブジェクトのセマンティック セグメンテーションと不確実性のモデリング
Keras - ImageDataGenerator Class
を使用することはわかっていますが、小さなオブジェクト タスクのセマンティック セグメンテーションに使用する手法とパラメーターがわかりません。誰かが私を啓発できますか?前もって感謝します。:)
deep-learning - 深層学習ではどの種類の画像前処理が優れているか
uint8 から float32 に変換するための 3 種類の前処理方法を次に示します。conv2d->バッチ ノルム-> ReLU 構造で使用することをお勧めするものはどれですか?
cs231nで述べたように、トレーニング セットで計算された平均値と標準偏差を使用してゼロ中心で正規化された画像。トレーニングセットが巨大な場合、この方法はコストがかかると思います。
tensorflow モデルのコードのように、
image /= 255 image -= 0.5 image *= 2.0
単純に画像を 255 で割る