2016-04-01から1ヶ月間の記事一覧

CMA2次試験ノート(H27午前)

GWなので機械学習の本を読みたいのは山々ですが、試験も近づいてきているので直近の過去問をみていきます。 カッコ書きのカテゴリは適当です。 H27午前: CMA2次試験ノート(H27午前) H27午後: CMA2次試験ノート(H27午後) H26午前: CMA2次試験ノート(H…

強化学習: ノート13

読んでいる本(出典): 強化学習 : Richard S.Sutton, Andrew G.Barto, 三上 貞芳, 皆川 雅章 : 本 : Amazon.co.jp前回:ノート12 / 次回: まだ 目次:強化学習読んだページ: 156~172ページ 以下、雑談。 「グラフの傾きが上向きであることから、時間と…

SarsaとQ学習の違い

参考文献: 強化学習 : Richard S.Sutton, Andrew G.Barto, 三上 貞芳, 皆川 雅章 : 本 : Amazon.co.jp 関連記事: 強化学習強化学習のTD解法である、Sarsa(方策オン型)とQ学習(方策オフ型)の違い。 ちゃんとした話は参考文献の6章を参照。以前考えた転…

強化学習: ノート12

読んでいる本(出典): 強化学習 : Richard S.Sutton, Andrew G.Barto, 三上 貞芳, 皆川 雅章 : 本 : Amazon.co.jp前回:ノート11 / 次回: まだ 目次:強化学習読んだページ: 147~156ページ 以下、自分の理解。 これまでのあらすじ: 強化学習の解法で…

強化学習: ノート11

読んでいる本(出典): 強化学習 : Richard S.Sutton, Andrew G.Barto, 三上 貞芳, 皆川 雅章 : 本 : Amazon.co.jp前回:ノート10 / 次回: まだ 目次:強化学習読んだページ: 119~147ページ 以下、自分の理解。 この本の2部で紹介される手法の特徴(111…

強化学習: ノート10 大反省会

読んでいる本(出典): 強化学習 : Richard S.Sutton, Andrew G.Barto, 三上 貞芳, 皆川 雅章 : 本 : Amazon.co.jp この記事はただのデバッグ記録です。 経緯 前回の記事の、「レンタカー2営業所問題」のスクリプトがバグっていた(現在は修正済)。 調査 …

強化学習: ノート10

読んでいる本(出典): 強化学習 : Richard S.Sutton, Andrew G.Barto, 三上 貞芳, 皆川 雅章 : 本 : Amazon.co.jp前回:ノート9 / 次回:ノート11 目次:強化学習今日読んだページ: 98~118ページ 以下、自分の解釈。 有限 MDP であるような強化学習問題…

基礎からのベイズ統計学 Skype読書会(3): 参加メモ

この勉強会に参加させていただきました: 基礎からのベイズ統計学 Skype読書会(3) - connpass 読んでいる本(出典): 基礎からのベイズ統計学: ハミルトニアンモンテカルロ法による実践的入門 | 豊田 秀樹 | 本 | Amazon.co.jp前回:メモ2 / 次回: まだ …

強化学習: ノート9

読んでいる本(出典): 強化学習 : Richard S.Sutton, Andrew G.Barto, 三上 貞芳, 皆川 雅章 : 本 : Amazon.co.jp前回:ノート8 / 次回:ノート10 目次:強化学習今日読んだページ: 93~98ページ 以下、自分の解釈・感想・雑談。 今日から4章。4章は強化…

強化学習: ノート8

読んでいる本(出典): 強化学習 : Richard S.Sutton, Andrew G.Barto, 三上 貞芳, 皆川 雅章 : 本 : Amazon.co.jp前回:ノート7 / 次回:ノート9 目次:強化学習今日読んだページ: 72~92ページ 以下、自分の解釈・感想・雑談。 (前回)「状態」は(ほ…

強化学習: ノート7

読んでいる本(出典): 強化学習 : Richard S.Sutton, Andrew G.Barto, 三上 貞芳, 皆川 雅章 : 本 : Amazon.co.jp前回:ノート6 / 次回:ノート8 目次:強化学習今日読んだページ: 68~71ページ 以下、自分の解釈・感想・雑談。 (前回)強化学習を定義…

雑記

マハラノビス距離 参考文献: Mahalanobis distance - Wikipedia, the free encyclopedia 点 と分布の距離であって次のように定義される。ただし、 は分布の平均ベクトルと共分散行列。 意味的には、ある点が、ある分布の平均から標準偏差の何倍離れたところ…