参考文献: 強化学習 : Richard S.Sutton, Andrew G.Barto, 三上 貞芳, 皆川 雅章 : 本 : Amazon.co.jp 関連記事: 強化学習強化学習のTD解法である、Sarsa(方策オン型)とQ学習(方策オフ型)の違い。 ちゃんとした話は参考文献の6章を参照。以前考えた転…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。