雑記: 最近のふぁぼより

後で読もうとふぁぼって結局読まないこととかあると思います。なので最近どんなことをふぁぼったか復習してみたんですが結局まだ読んでいません。

「A Distributional Perspective on Reinforcement Learning

 [1707.06887] A Distributional Perspective on Reinforcement Learning

強化学習において Bellman 最適方程式による行動価値の更新のとき、期待値に更新するのではなく分布のまま扱おうという話のようです。期待値で更新する方法でもリスク回避的な学習にはできるけどって言っていると思います。行動価値を分布として保持するのはイメージが湧くような気がしないでもないですがそれでどう方策を決めるのかはまだ全然読んでいないのでわかりません。確率的に行動するんだろうと思います。

「Reducing Dimensionality from Dimensionality Reduction Techniques」

 Reducing Dimensionality from Dimensionality Reduction Techniques

次元削減手法(PCA、t-SNE、自己符号化器)に関する解説のようです。

「深層学習とベイズ統計」

 深層学習とベイズ統計

@yutakashino 様のスライドです。決定論的モデルであるニューラルネットを確率論的モデルに modify したいため、ニューラルネットの各重みパラメータ  \theta を「ある分布からの実現値」として取り扱おうという話だと思います。
_人人人人人人人人人人人人人人人人_
> 学習の収束のふるまいがキモい < (スライド13頁)
  ̄Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y ̄

「Deep Reinforcement Learning, Decision Making, and Control」

 https://sites.google.com/view/icml17deeprl

深層強化学習のチュートリアルのようです。ICML2017 で講演があったのでしょうか。

「物理のいらない量子アニーリング入門」

 物理のいらない量子アニーリング入門 - Platinum Data Blog by BrainPad

量子アニーリング入門ということです。github でコードが公開されているということです。
GitHub - ohtaman/anneal

「Fundamentals of Nonparametric Bayesian Inference (Cambridge Series in Statistical and Probabilistic Mathematics)」

Fundamentals of Nonparametric Bayesian Inference (Cambridge Series in Statistical and Probabilistic Mathematics)Fundamentals of Nonparametric Bayesian Inference (Cambridge Series in Statistical and Probabilistic Mathematics)
Subhashis Ghosal Aad van der Vaart

Cambridge University Press 2017-06-26
売り上げランキング : 2101

Amazonで詳しく見る
by G-Tools

比較的最近出た本らしいです。670ページらしいです。購入したいですが置く場所がありません。

「On the State of the Art of Evaluation in Neural Language Models」

 [1707.05589] On the State of the Art of Evaluation in Neural Language Models

自然言語処理には結局 LSTM がよいという話のようです。なんかもう state-of-the-art がタイトルになってしまいました。

「~簡単!炎上のさせ方講座~」

@jagarikin 様のツイートより。炎上のさせ方が簡単にわかります。
ただ臨場感あふれる炎上にするにはコツが要るらしく、適当な実装では上手くいきませんでした(下図)。なんか地面が全体的にのっぺり燃えているようになってしまい、点々と炎を吹いているようにならなかったです。炎上のさせ方は奥が深いようです。また頑張ります。

f:id:cookie-box:20170808113251g:plain

あと PyTorch とか最近話題ですね。