- 「A Distributional Perspective on Reinforcement Learning」
- 「Reducing Dimensionality from Dimensionality Reduction Techniques」
- 「深層学習とベイズ統計」
- 「Deep Reinforcement Learning, Decision Making, and Control」
- 「物理のいらない量子アニーリング入門」
- 「Fundamentals of Nonparametric Bayesian Inference (Cambridge Series in Statistical and Probabilistic Mathematics)」
- 「On the State of the Art of Evaluation in Neural Language Models」
- 「~簡単!炎上のさせ方講座~」
「A Distributional Perspective on Reinforcement Learning」
[1707.06887] A Distributional Perspective on Reinforcement Learning
強化学習において Bellman 最適方程式による行動価値の更新のとき、期待値に更新するのではなく分布のまま扱おうという話のようです。期待値で更新する方法でもリスク回避的な学習にはできるけどって言っていると思います。行動価値を分布として保持するのはイメージが湧くような気がしないでもないですがそれでどう方策を決めるのかはまだ全然読んでいないのでわかりません。確率的に行動するんだろうと思います。
「Reducing Dimensionality from Dimensionality Reduction Techniques」
Reducing Dimensionality from Dimensionality Reduction Techniques
次元削減手法(PCA、t-SNE、自己符号化器)に関する解説のようです。
「深層学習とベイズ統計」
@yutakashino 様のスライドです。決定論的モデルであるニューラルネットを確率論的モデルに modify したいため、ニューラルネットの各重みパラメータ を「ある分布からの実現値」として取り扱おうという話だと思います。
_人人人人人人人人人人人人人人人人_
> 学習の収束のふるまいがキモい < (スライド13頁)
 ̄Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y ̄
「Deep Reinforcement Learning, Decision Making, and Control」
深層強化学習のチュートリアルのようです。ICML2017 で講演があったのでしょうか。
「Fundamentals of Nonparametric Bayesian Inference (Cambridge Series in Statistical and Probabilistic Mathematics)」
Fundamentals of Nonparametric Bayesian Inference (Cambridge Series in Statistical and Probabilistic Mathematics)
Subhashis Ghosal Aad van der Vaart
Cambridge University Press 2017-06-26
売り上げランキング : 2101
Amazonで詳しく見る by G-Tools
比較的最近出た本らしいです。670ページらしいです。購入したいですが置く場所がありません。
「On the State of the Art of Evaluation in Neural Language Models」
[1707.05589] On the State of the Art of Evaluation in Neural Language Models
自然言語処理には結局 LSTM がよいという話のようです。なんかもう state-of-the-art がタイトルになってしまいました。
「~簡単!炎上のさせ方講座~」
~簡単!炎上のさせ方講座~ pic.twitter.com/fKSOXj1Xeb
— じゃがりきん (@jagarikin) 2017年8月7日
@jagarikin 様のツイートより。炎上のさせ方が簡単にわかります。
ただ臨場感あふれる炎上にするにはコツが要るらしく、適当な実装では上手くいきませんでした(下図)。なんか地面が全体的にのっぺり燃えているようになってしまい、点々と炎を吹いているようにならなかったです。炎上のさせ方は奥が深いようです。また頑張ります。

あと PyTorch とか最近話題ですね。