次のコードがあります
public void alearningrate(){
//adopt learningrate
System.out.println(errorpositive+""+learningrate);
if ((errorpositive&&errorgradient>0)||!errorpositive&&errorgradient<0){
learningrate=learningrate*1.5;
}else{
learningrate=learningrate*0.75;
}
if (learningrate<0.0001){
learningrate=0.0001;
}
}
public void lastblame(double blame){
errorpositive=errorgradient>0;
errorgradient= Math.exp(-value)/Math.pow(1+Math.exp(-value), 2)*blame;
if (value==Double.NaN){
System.out.println("nan detected=?");
errorgradient=1;
}
for (int i=0; i<weight.length;i++){
weight[i]=weight[i]+learningrate*source[i].output()*errorgradient;
}
//alearningrate();
}
public void hiddenblame(double blame){
System.out.println(value);
errorpositive=errorgradient>0;
errorgradient=Math.exp(-value)/Math.pow(1+Math.exp(-value), 2)*blame;
if (value==Double.NaN){
System.out.println("nan detected=?");
errorgradient=1;
}
for (int i=0; i<weight.length;i++){
weight[i]=weight[i]+learningrate*source[i].output()*errorgradient;
}
System.out.println(errorgradient);
alearningrate();
}
ただし、これにより errorgradient がすぐに NaN になりますが、alearningrate() を削除することにした場合、コードは正常に実行されます。関数 errorgradient 関数を調べたところ、決して nan が生成されないはずです。NaN を取得し続ける理由を知っている人はいますか?