画像分類タスクに Keras 2.0.4 (TensorFlow バックエンド) を使用しています。独自のネットワークをトレーニングしようとしています (事前トレーニング済みのパラメーターなし)。私のデータは巨大なので、すべてをメモリにロードすることはできません。このためImageDataGenerator()
、 、flow_from_directory()
およびを使用しfit_generator()
ます。
ImageDataGenerator
オブジェクトの作成:
train_datagen = ImageDataGenerator(preprocessing_function = my_preprocessing_function) # only preprocessing; no augmentation; static data set
my_preprocessing_function は、画像をドメイン [0,255] に再スケーリングし、平均削減によってデータを中央に配置します (VGG16 または VGG19 の前処理と同様)。
オブジェクトのメソッドflow_from_directory()
を使用:ImageDataGenerator
train_generator = train_datagen.flow_from_directory(
path/to/training/directory/with/five/subfolders,
target_size=(img_width, img_height),
batch_size=64,
classes = ['class1', 'class2', 'class3', 'class4', 'class5'],
shuffle = True,
seed = 1337,
class_mode='categorical')
(validation_generator を作成するために同じことが行われます。)
モデル (損失関数: categorical crossentropy
、オプティマイザー: Adam
) を定義してコンパイルした後、以下を使用してモデルをトレーニングしfit_generator()
ます。
model.fit_generator(
train_generator,
steps_per_epoch=total_amount_of_train_samples/batch_size,
epochs=400,
validation_data=validation_generator,
validation_steps=total_amount_of_validation_samples/batch_size)
問題:
エラー メッセージは表示されませんが、トレーニングがうまく機能しません。400 エポックの後でも、精度は 20% 前後で変動します (これは、これらのクラスの 1 つをランダムに選択するのと同じくらい良い値です)。実際、分類子は常に「class1」を予測します。同じことは、1 エポックのトレーニングの後でも当てはまります。ランダムな重みを初期化していますが、これはなぜですか? なにが問題ですか?私は何が欠けていますか?
中古モデル
x = Input(shape=input_shape)
# Block 1
x = Conv2D(16, (3, 3), activation='relu', padding='same', name='block1_conv1')(x)
x = Conv2D(16, (5, 5), activation='relu', padding='same', name='block1_conv2')(x)
x = MaxPooling2D((2, 2), strides=(2, 2), name='block1_pool')(x)
# Block 2
x = Conv2D(64, (3, 3), activation='relu', padding='same', name='block2_conv1')(x)
x = Conv2D(64, (5, 5), activation='relu', padding='same', name='block2_conv2')(x)
x = MaxPooling2D((2, 2), strides=(2, 2), name='block2_pool')(x)
# Block 3
x = Conv2D(16, (1, 1), activation='relu', padding='same', name='block3_conv1')(x)
# Block 4
x = Conv2D(256, (3, 3), activation='relu', padding='valid', name='block4_conv1')(x)
x = Conv2D(256, (5, 5), activation='relu', padding='valid', name='block4_conv2')(x)
x = MaxPooling2D((2, 2), strides=(2, 2), name='block4_pool')(x)
# Block 5
x = Conv2D(1024, (3, 3), activation='relu', padding='valid', name='block5_conv1')(x)
x = MaxPooling2D((2, 2), strides=(2, 2), name='block5_pool')(x)
# topping
x = Dense(1024, activation='relu', name='fc1')(x)
x = Dense(1024, activation='relu', name='fc2')(x)
predictions = Dense(5, activation='softmax', name='predictions')(x)