水曜Stan - 「StanとRでベイズ統計モデリング」読書会#2に参加させていただきました。
spml4dm.connpass.com
勉強会メモ
今回は Chapter5(54〜78ページ)のもくもくでした。Chapter5 は基本的な統計モデルの紹介。以下、大事だと思ったことのメモ。
重回帰:
- 各推定対象パラメータの大きさが同程度(1程度)になるようにデータをスケーリングしておくといいかも。
- MCMC に使用したデータの範囲外になる未知データに同じ事後モデルをそのまま適用するべきではない(使用データ範囲外では MCMC の結果が信用できるか全然わからないし、そのまま適用したら「出席率」がマイナスみたいな変なことになったりもするかも)。
- モデルのあてはまりのよさを絵で確認するには、「観測値—予測値」プロットが y=x の周囲にあるか、MAP残差が想定した分散の正規分布にしたがっているかをみるとよい。
二項ロジスティック回帰:
- 0〜1 をはみ出しちゃうっていうか出力が 0〜1 になるようにする。
- (途中)
ロジスティック回帰:
- (途中)
ポアソン回帰:
- ポアソン分布は一時間に観測される流れ星の数みたいなやつ。
- (途中)
- 「図5.3で実測値が小さい点だけが直線の上側にある(62ページ)」: 定数項を大きく取りすぎているパターン? スケーリングを誤るとこういう罠にはまりそう?
- オッズ(68ページ)は豊田先生の本でみた。
- 「解析を進めていくうちに、授業日の天気が出席確率にかなりの影響を与えることがわかってきた(69ページ)」: 雨だと人いないよね、大学の講義。
- バイオリンプロット(74ページ): 箱ひげ図よりデータの分布の形を表せる。知らんかった。