5

ケラスでは、いくつかのレイヤーを共有するモデルのアンサンブルをトレーニングしたいと考えています。それらは次の形式です。

x ---> f(x) ---> g_1(f(x))

x ---> f(x) ---> g_2(f(x))

...

x ---> f(x) ---> g_n(f(x))

ここで f(x) は重要な共有レイヤーです。g_1 から g_n には固有のパラメーターがあります。

各トレーニング段階で、データ x は n 個のネットワークの 1 つ、つまり i 番目のネットワークに供給されます。g_i(f(x)) の損失は、勾配ベースのオプティマイザによって最小化/減少されます。このようなモデルを定義してトレーニングするにはどうすればよいでしょうか?

前もって感謝します!

4

1 に答える 1

10

機能モデルを使用して簡単に行うことができます。

小さな例..それに基づいて構築できます:

import numpy as np
from keras.models import Model
from keras.layers import Dense, Input

X = np.empty(shape=(1000,100))
Y1 = np.empty(shape=(1000))
Y2 = np.empty(shape=(1000,2))
Y3 = np.empty(shape=(1000,3))

inp = Input(shape=(100,))
dense_f1 = Dense(50)
dense_f2 = Dense(20)

f = dense_f2(dense_f1(inp))

dense_g1 = Dense(1)
g1 = dense_g1(f)

dense_g2 = Dense(2)
g2 = dense_g2(f)

dense_g3 = Dense(3)
g3 = dense_g3(f)


model = Model([inp], [g1, g2, g3])
model.compile(loss=['mse', 'binary_crossentropy', 'categorical_crossentropy'], optimizer='rmsprop')

model.summary()

model.fit([X], [Y1, Y2, Y3], nb_epoch=10)

編集:

コメントに基づいて、いつでもさまざまなモデルを作成し、トレーニングの必要性に基づいてトレーニング ループを自分で作成できます。model.summary()すべてのモデルが初期レイヤーを共有していることがわかります。これが例の拡張です

model1 = Model(inp, g1)
model1.compile(loss=['mse'], optimizer='rmsprop')
model2 = Model(inp, g2)
model2.compile(loss=['binary_crossentropy'], optimizer='rmsprop')
model3 = Model(inp, g3)
model3.compile(loss=['categorical_crossentropy'], optimizer='rmsprop')
model1.summary()
model2.summary()
model3.summary()

batch_size = 10
nb_epoch=10
n_batches = X.shape[0]/batch_size


for iepoch in range(nb_epoch):
    for ibatch in range(n_batches):
        x_batch = X[ibatch*batch_size:(ibatch+1)*batch_size]
        if ibatch%3==0:
            y_batch = Y1[ibatch*batch_size:(ibatch+1)*batch_size]
            model1.train_on_batch(x_batch, y_batch)      
        elif ibatch%3==1:
            y_batch = Y2[ibatch*batch_size:(ibatch+1)*batch_size]
            model2.train_on_batch(x_batch, y_batch)      
        else:
            y_batch = Y3[ibatch*batch_size:(ibatch+1)*batch_size]
            model3.train_on_batch(x_batch, y_batch)      
于 2017-01-12T04:38:07.683 に答える