私はいくつかの基本的なニューラルネットワークメソッド、特に活性化関数を書いていますが、数学に関する私のごみの知識の限界に達しています。それぞれの範囲(-1/1)(0/1)などは理解していますが、説明や実装が異なるため、混乱しています。
具体的には、シグモイド、ロジスティック、バイポーラシグモイド、タンなどです。
シグモイドは、範囲に関係なく、関数の形状を単純に記述していますか?もしそうなら、tanhは「シグモイド関数」ですか?
論文で「tanh」と比較した「bipolarsigmoid」を見てきましたが、同じコードで(さまざまなライブラリに)実装された両方の関数を見てきました。
((2 /(1 + Exp(-2 * n)))-1)。それらはまったく同じものですか?
同様に、同じコードで実装されたロジスティックとシグモイドのアクティベーションを見てきました。
(1 /(1 + Exp(-1 * n)))。これらも同等ですか?
最後に、実際にはそれだけでも重要ですか?ウィキで非常によく似たシグモイド関数のプロットを見ることができます-これらのいずれかを使用できますか?他のものよりも計算がかなり速いように見えるものもあります。