4 クラスのタスクと 10 クラスのタスクを予測する同じネットワークによって生成される 2 つの出力を結合しようとしています。次に、これらの出力を組み合わせて、最終ターゲットとして使用する長さ 14 の配列を作成します。
これは積極的に機能しているように見えますが、予測は常に1つのクラスに対するものであるため、14のオプションから2ではなく1を選択することにのみ関係する確率分布が生成されます。実際に必要なのは、2つの予測を提供することです。各クラス。これは全部同じモデルで作ってほしい。
input = Input(shape=(100, 100), name='input')
lstm = LSTM(128, input_shape=(100, 100)))(input)
output1 = Dense(len(4), activation='softmax', name='output1')(lstm)
output2 = Dense(len(10), activation='softmax', name='output2')(lstm)
output3 = concatenate([output1, output2])
model = Model(inputs=[input], outputs=[output3])
ここでの問題は、適切な損失関数と予測方法を決定することですか? 予測のために、ソフトマックスの後に各レイヤーの出力を簡単に取得できますが、トレーニングするこれらの各要素の損失関数を設定する方法がわかりません。
何か案は?
どうもありがとう