「StanとRでベイズ統計モデリング」読書会#2：参加メモ（途中）

水曜Stan - 「StanとRでベイズ統計モデリング」読書会#2に参加させていただきました。
spml4dm.connpass.com

勉強会メモ

今回は Chapter5（54〜78ページ）のもくもくでした。Chapter5 は基本的な統計モデルの紹介。
以下、大事だと思ったことのメモ。

重回帰：

各推定対象パラメータの大きさが同程度（1程度）になるようにデータをスケーリングしておくといいかも。
MCMC に使用したデータの範囲外になる未知データに同じ事後モデルをそのまま適用するべきではない（使用データ範囲外では MCMC の結果が信用できるか全然わからないし、そのまま適用したら「出席率」がマイナスみたいな変なことになったりもするかも）。
モデルのあてはまりのよさを絵で確認するには、「観測値—予測値」プロットが y=x の周囲にあるか、MAP残差が想定した分散の正規分布にしたがっているかをみるとよい。

二項ロジスティック回帰：

ロジスティック回帰：

ポアソン回帰：

「図5.3で実測値が小さい点だけが直線の上側にある（62ページ）」：定数項を大きく取りすぎているパターン？スケーリングを誤るとこういう罠にはまりそう？
オッズ（68ページ）は豊田先生の本でみた。
- 基礎からのベイズ統計学: ハミルトニアンモンテカルロ法による実践的入門（本読みまとめ）
「解析を進めていくうちに、授業日の天気が出席確率にかなりの影響を与えることがわかってきた（69ページ）」：雨だと人いないよね、大学の講義。
バイオリンプロット（74ページ）：箱ひげ図よりデータの分布の形を表せる。知らんかった。
- ヴァイオリンプロット | 四分位点やデータの分布密度などが確認できる
- 箱ひげ図とバイオリンプロットの印象の違い - 広告／統計／アニメ／映画等に関するブログ