machine-learning - Q-Learning アルゴリズムはオーバートレーニングになる可能性がありますか?

翻译自：https://stackoverflow.com/questions/39316972 2016-09-04T12:34:43.617

267 次

1

Q-Learning アルゴリズムは、一意な最適ポリシーの Q に収束することが証明されています。では、Q-Learning アルゴリズムがオーバートレーニングになることはないと結論付けるのは正しいでしょうか?

1 に答える 1