読者です 読者をやめる 読者になる 読者になる

Rによるベイジアン動的線型モデル: ノート12

読んでいる本(出典): Rによるベイジアン動的線形モデル (統計ライブラリー) | G.ペトリス, S.ペトローネ, P.カンパニョーリ, 和合 肇, 萩原 淳一郎 | 本 | Amazon.co.jp

前回:ノート11 / 次回:ノート13
目次:Rによるベイジアン動的線型モデル

今日読んだページ: 93~96ページ
以下、自分の解釈・感想。

  • ローカルレベル・モデルを適用してみたら、予測誤差が正規分布であるかどうかとか、予測誤差の自己相関をチェックするのは大事(正規分布でなかったり、自己相関があったら、仮定が間違っている)。
  • ローカルレベル・モデルで予測してみると結果的に指数平滑化と変わらない場合も。

前回の本読みから時間を空けてしまって、どうしてローカルレベル・モデルがトレンドモデルの仲間なのかよくわからなくなっているけど、前回のノートをみてもわかっていないっぽい。



Shapiro–Wilk 検定とは: Shapiro–Wilk test - Wikipedia, the free encyclopedia

R では標準で shapiro.test として使用可能。
shapiro.test を標準正規分布から抽出した100サンプルに適用(八百長)。

> shapiro.test(rnorm(100))

        Shapiro-Wilk normality test

data:  rnorm(100)
W = 0.9872, p-value = 0.4503

ここで企画: コインを何回投げると表の出た回数のヒストグラム正規分布が描けるか(ここでは、5%有意水準で帰無仮説が棄却されないか)?
※ 最低でも3回は投げないとそもそも検定できない。

> shapiro.test(rbinom(1, size=1, prob=0.5))
 Error in shapiro.test(rbinom(1, size = 1, prob = 0.5)) : 
   sample size must be between 3 and 5000

「1回投げる」を3セット行う(計3回投げる)。→ 描けないというか描けると思っている方がおかしい。

> shapiro.test(rbinom(3, size=1, prob=0.5))
W = 0.75, p-value < 2.2e-16

「10回投げる」を10セット行う(計100回投げる)。→ 検定上、描けることになる。

> shapiro.test(rbinom(10, size=10, prob=0.5))
W = 0.9108, p-value = 0.2869

「100回投げる」を10セット行う(計1000回投げる)。→ これも描けることになる。

> shapiro.test(rbinom(10, size=100, prob=0.5))
W = 0.914, p-value = 0.3093

「10回投げる」を100セット行う(計1000回投げる)。→ 描けない。結構繰り返してもp値は0.05を超えない。

> shapiro.test(rbinom(100, size=10, prob=0.5))
W = 0.9485, p-value = 0.0006629

「100回投げる」を100セット行う(計10000回投げる)。→ 描ける。結構繰り返してもp値は0.05を超える。

> shapiro.test(rbinom(100, size=100, prob=0.5))
W = 0.9808, p-value = 0.1534

まとめ: セット数が少ない場合は検定力を疑うべき。その辺ふわふわしたままで出来合いの関数だけつかうと危険。という自戒。