4

1 つの出力ニューロンを持つニューラル ネットワークがあるとします。シナリオの概要を説明すると、ネットワークは入力として画像を取得し、その画像内で 1 つのオブジェクトを見つける必要があります。シナリオを単純化するために、オブジェクトの x 座標のみを出力する必要があります。

ただし、オブジェクトはさまざまな場所にある可能性があるため、ネットワークの出力には確かにノイズが含まれます。さらに、画像が少しぼやけている場合があります。

したがって、ネットワークにオブジェクトの位置のガウス分布を出力させる方がよいのではないかと考えました。

残念ながら、私はこのアイデアをモデル化するのに苦労しています。出力をどのように設計しますか? 画像の幅が 100 ピクセルの場合、平坦化された 100 次元のベクトルは? ネットワークがこのベクトルのガウス分布に収まるようにするには、近似オブジェクトの位置を取得するためにピークを見つけるだけでよいですか?

さらに、コスト関数と教師の信号を理解できません。教師信号は、オブジェクトの正確な x 座標で完全なガウス分布になるでしょうか? では、コスト関数をモデル化する方法は? 現在、ソフトマックス クロス エントロピーまたは単純な二乗誤差があります。ネットワークの出力 <-> 実 x 座標です。

このシナリオを処理するためのより良い方法はありますか? ノイズなどの情報なしにネットワークが単一の値を出力しないようにするためのより良い分布または他の方法のように?

4

1 に答える 1