入力信号の将来の応答を予測するモデルを作成したいのですが、私のネットワークのアーキテクチャは[3、5、1]です。
- 3つの入力、
- 隠れ層の5つのニューロン、および
- 出力層に1つのニューロン。
私の質問は次のとおりです。
- 非表示レイヤーと出力レイヤーごとに個別のバイアスを設定する必要がありますか?
- 各レイヤーでBIASに重みを割り当てる必要がありますか(BIASがネットワークに余分な価値をもたらし、ネットワークに過度の負担をかけるため)?
- なぜBIASは常に1に設定されているのですか?etaの値が異なる場合、BIASに異なる値を設定しないのはなぜですか?
- 非線形関数に常に対数シグモイド関数を使用するのはなぜですか?tanhを使用できますか?