4

4116 224x224x3 (RGB) の航空写真を含む不均衡で小さなデータセットがあります。データセットが十分に大きくないため、過剰適合の問題が発生する可能性が非常に高くなります。以下で説明するように、画像の前処理とデータ拡張は、この問題に取り組むのに役立ちます。

「オーバーフィッティングは、学習するサンプルが少なすぎるために発生し、新しいデータに一般化できるモデルをトレーニングできなくなります。無限のデータが与えられると、モデルは手元のデータ分布のあらゆる可能な側面にさらされます:決してオーバーフィット データ拡張は、信頼できる画像を生成する多数のランダム変換を介してサンプルを拡張することにより、既存のトレーニング サンプルからより多くのトレーニング データを生成するアプローチを採用しています。」

Deep Learning with Python by François Chollet、ページ 138-139、5.2.5 データ拡張の使用

Medium - Image Data Preprocessing for Neural Networksを読み、Stanford のCS230 - Data Preprocessingおよび CS231 - Data Preprocessingコースを調べました。SO questionでもう一度強調されており、「すべてに適合する」ソリューションがないことを理解しています。これが私にこの質問をさせた理由です:

「高い空間解像度を達成したいので、翻訳の増強は使用されませんでした。」

参考:Researchgate - 深層畳み込みニューラル ネットワークを使用した都市リモート センシング画像における小さなオブジェクトのセマンティック セグメンテーションと不確実性のモデリング



Keras - ImageDataGenerator Class を使用することはわかっていますが、小さなオブジェクト タスクのセマンティック セグメンテーションに使用する手法とパラメーターがわかりません。誰かが私を啓発できますか?前もって感謝します。:)

from keras.preprocessing.image import ImageDataGenerator

datagen = ImageDataGenerator(
    rotation_range=20,      # is a value in degrees (0–180)
    width_shift_range=0.2,  # is a range within which to randomly translate pictures horizontally.
    height_shift_range=0.2, # is a range within which to randomly translate pictures vertically.
    shear_range=0.2,        # is for randomly applying shearing transformations.
    zoom_range=0.2,         # is for randomly zooming inside pictures.
    horizontal_flip=True,   # is for randomly flipping half the images horizontally
    fill_mode='nearest',    # is the strategy used for filling in newly created pixels, which can appear after a rotation or a width/height shift
    featurewise_center=True,
    featurewise_std_normalization=True)

datagen.fit(X_train)
4

1 に答える 1

5

拡張フェーズと前処理フェーズは、常に発生している問題によって異なります。データセットを拡大できる可能性のある拡張をすべて考える必要があります。しかし、最も重要なことは、実際の例では起こり得ない方法で新しいトレーニング サンプルを作成する極端な拡張を実行しないことです。実際の例が水平方向に反転することを予期しない場合は、水平方向の反転を実行しないでください。これにより、モデルに誤った情報が提供されます。入力画像に起こりうるすべての変化を考え、既存の画像から人為的に新しい画像を作成してみてください。Keras の多くの組み込み関数を使用できます。ただし、モデルの入力に存在する可能性が低い新しい例は作成されないことに注意してください。

あなたが言ったように、すべてがデータに依存しているため、「すべてに適合する」ソリューションはありません。データを分析し、それに関するすべてを構築します。

小さなオブジェクトについて - チェックする必要がある 1 つの方向は、背景と比較してターゲット ボリュームの影響を強調する損失関数です。Dice Loss または Generalized Dice Loss を見てください。

于 2019-07-24T10:24:40.533 に答える