--adaptive フラグが使用されたときに VW によって行われた更新に関する次の 2 つのプレゼンテーションを見ています。これらは違うようです。
- http://www.slideshare.net/jakehofman/technical-tricks-of-vowpal-wabbit
- https://github.com/JohnLangford/vowpal_wabbit/wiki/v6.1_tutorial.pdf
これら2つの説明を(それぞれ):
#1
#2
私の質問:
これらのうち正しいものはどれですか (または同じものですか)?
数値 1 では、t+1 の例の勾配が分母に使用されているようです。これはどのように行われますか?これは、新しい重み (ラベル w_i) が、たとえば t+1 の重みであることを意味しますか?