performance - Keras は fit_generator() を使用してトレーニングしません

Question

画像分類タスクに Keras 2.0.4 (TensorFlow バックエンド) を使用しています。独自のネットワークをトレーニングしようとしています (事前トレーニング済みのパラメーターなし)。私のデータは巨大なので、すべてをメモリにロードすることはできません。このためImageDataGenerator()、、flow_from_directory()およびを使用しfit_generator()ます。

ImageDataGeneratorオブジェクトの作成:

train_datagen = ImageDataGenerator(preprocessing_function = my_preprocessing_function) # only preprocessing; no augmentation; static data set

my_preprocessing_function は、画像をドメイン [0,255] に再スケーリングし、平均削減によってデータを中央に配置します (VGG16 または VGG19 の前処理と同様)。

オブジェクトのメソッドflow_from_directory()を使用:ImageDataGenerator

train_generator = train_datagen.flow_from_directory(
    path/to/training/directory/with/five/subfolders,
    target_size=(img_width, img_height),
    batch_size=64,
    classes = ['class1', 'class2', 'class3', 'class4', 'class5'],
    shuffle = True,
    seed = 1337,
    class_mode='categorical')

(validation_generator を作成するために同じことが行われます。)

モデル (損失関数: categorical crossentropy、オプティマイザー: Adam) を定義してコンパイルした後、以下を使用してモデルをトレーニングしfit_generator()ます。

model.fit_generator(
    train_generator,
    steps_per_epoch=total_amount_of_train_samples/batch_size,
    epochs=400,
    validation_data=validation_generator,
    validation_steps=total_amount_of_validation_samples/batch_size)

問題:
エラーメッセージは表示されませんが、トレーニングがうまく機能しません。400 エポックの後でも、精度は 20% 前後で変動します (これは、これらのクラスの 1 つをランダムに選択するのと同じくらい良い値です)。実際、分類子は常に「class1」を予測します。同じことは、1 エポックのトレーニングの後でも当てはまります。ランダムな重みを初期化していますが、これはなぜですか? なにが問題ですか？私は何が欠けていますか？

中古モデル

x = Input(shape=input_shape)

# Block 1
x = Conv2D(16, (3, 3), activation='relu', padding='same', name='block1_conv1')(x)
x = Conv2D(16, (5, 5), activation='relu', padding='same', name='block1_conv2')(x)
x = MaxPooling2D((2, 2), strides=(2, 2), name='block1_pool')(x)

# Block 2
x = Conv2D(64, (3, 3), activation='relu', padding='same', name='block2_conv1')(x)
x = Conv2D(64, (5, 5), activation='relu', padding='same', name='block2_conv2')(x)
x = MaxPooling2D((2, 2), strides=(2, 2), name='block2_pool')(x)

# Block 3
x = Conv2D(16, (1, 1), activation='relu', padding='same', name='block3_conv1')(x)

# Block 4
x = Conv2D(256, (3, 3), activation='relu', padding='valid', name='block4_conv1')(x)
x = Conv2D(256, (5, 5), activation='relu', padding='valid', name='block4_conv2')(x)
x = MaxPooling2D((2, 2), strides=(2, 2), name='block4_pool')(x)

# Block 5
x = Conv2D(1024, (3, 3), activation='relu', padding='valid', name='block5_conv1')(x)
x = MaxPooling2D((2, 2), strides=(2, 2), name='block5_pool')(x)

# topping 
    x = Dense(1024, activation='relu', name='fc1')(x)
    x = Dense(1024, activation='relu', name='fc2')(x)
predictions = Dense(5, activation='softmax', name='predictions')(x)

EDIT
端子出力

performance - Keras は fit_generator() を使用してトレーニングしません

0 に答える 0

Related

Reference