1

r基本的に、L2 ノルムに依存するカーネルはここで計算され、最初に値をクリップすることがわかります。テンソルフロー確率では、 を大きなが有限の数にsqrt置き換える変更された勾配でを使用します。私の質問は、それらが同等かどうか、またはどちらかが優れているかどうかです。grad(|x - x'|)x=x'

4

1 に答える 1