隼時系列本: ノート6

以下の本を読みます。

時系列分析と状態空間モデルの基礎: RとStanで学ぶ理論と実装時系列分析と状態空間モデルの基礎: RとStanで学ぶ理論と実装
馬場 真哉

プレアデス出版 2018-02-14
売り上げランキング : 7742

Amazonで詳しく見る
by G-Tools
※ 以下、キャラクターが会話します。原作とは関係ありません。上の本からそれる話も多いです。誤りがあればご指摘ください。
前回:ノート5 / 次回:まだ
f:id:cookie-box:20180305231302p:plain:w60

144ページからは、VAR モデル? …これは、複数の時系列の過去の値で複数の時系列を回帰するモデルで、複数時系列を用いることによってよりよい予測ができるようにしたり、時系列化間の相互作用を調べる目的で利用するのか…具体的に、どんな時系列に対して適用するんだろう?

f:id:cookie-box:20180305232608p:plain:w60

例えば春名さんの毎月の収入と、毎月のドーナツ消費量という2つの時系列データがあったとして、春名さんは収入が増えるほどドーナツを消費するかもしれませんが、好物のドーナツを消費することによって仕事に精が出て収入も増加するかもしれません。と考えると、春名さんの収入とドーナツ消費量の間には相互作用があるのではないかと疑われます。まあこの例は本に載っていないのでGranger因果性が存在するかはわかりませんが。

f:id:cookie-box:20180305231302p:plain:w60

本に載ってたらおかしいだろ! ハルナのドーナツ消費行動が!

f:id:cookie-box:20180305232608p:plain:w60

また沖本氏の本からの引用ですが、こちらの本の82ページに載っている例は日本の株式収益率、英国の株式収益率、米国の株式収益率でGranger因果性の存在が認められていますね。
経済・ファイナンスデータの計量時系列分析 (統計ライブラリー) | 沖本 竜義 |本 | 通販 | Amazon

f:id:cookie-box:20180305231302p:plain:w60

ジュン、ごめん、そのグレンジャー何とかの前に、こっちの本の145ページの、 SUR モデルっていうのがよくわからなかったんだけど。 x_t y_t が互いに説明変数になっていなくて、ノイズどうしが相関をもってると SUR モデルっていうのか? でも  x_t y_t の説明変数のセットは共通なのに「見かけ上無相関な回帰モデル」と呼ぶのもよくわかんないし、そう呼んだとしてそれが何っていう…。

f:id:cookie-box:20180305232608p:plain:w60

調べてみましょう。ウィキペディアSeemingly unrelated regressions - Wikipedia)によると、SUR モデルというのは時系列の VAR モデルに限らず、一般の線形回帰モデルを複数束ねたものが、被説明変数が互いには説明変数に入っていない状態であって、ノイズが相関をもつかもしれない場合を指しているようですね。例えば以下のようなイメージです。

 \begin{cases} x = a_0 + a_1 x_1 + a_2 x_2 + a_3 x_3 + \varepsilon_x \\ y = b_0 + b_1 y_1 + b_2 y_2 + \varepsilon_y \end{cases}
この2つの回帰式はぱっと見個別に推定できそうで、「無相関」に見えます。しかし、 \varepsilon_x \varepsilon_y が無相関である保証はありません。なので、あくまで「見かけ上無相関」であり、それぞれの回帰式を個別に推定するのではなく2つの回帰式を同時にFGLS(実行可能一般化最小二乗法)で推定する必要があります(個別に最小2乗推定すると、パラメータの推定値の有効性が劣ります)。しかし、以下の2つの特殊なケースでは、個別に最小2乗推定してもFGLSと同じ結果が得られるんです。
  •  \varepsilon_x \varepsilon_y が無相関である場合(この場合は、見かけ上ではなく実際に無相関なので当然ですね)。
  • 全ての回帰式で、右辺に登場する説明変数のセットが共通の場合。なんでこの場合に個別に最小2乗推定できるかは面倒なんで以下の論文の351ページまで見といてください。
    • Zellner, A. (1962). An Efficient Method of Estimating Seemingly Unrelated Regressions and Tests for Aggregation Bias. Journal of the American Statistical Association, 57(298), 348-368.
そして、ハヤトの言う通り、VARモデルはこの特殊なケースの後者なので、一般的に「見かけ上無相関な回帰モデル」というよりは、「説明変数が共通なのであまり見かけ上無相関にも見えないし、普通に無相関でないが、個別に最小2乗推定しても同時にFGLSしたときと同じ結果が得られる特殊なケース」と言った方がわかりやすいかもしれません。

f:id:cookie-box:20180305231302p:plain:w60

なっが!

f:id:cookie-box:20180305232608p:plain:w60

次にGranger因果性ですが、来期の春名さんのドーナツ消費量を、春名さんのドーナツ消費量のみを利用して予測した場合と、春名さんのドーナツ消費量に加えて春名さんの収入も利用して予測した場合で、後者の方が2乗誤差が小さくなるなら、春名さんの収入から春名さんのドーナツ消費量へのGranger因果性が存在するといいます。この検証にはF検定っぽいことをやります。

f:id:cookie-box:20180305231302p:plain:w60

144ページに書いてあった「普段私たちが使っている因果という言葉の意味とは(後略)」ってのは?

f:id:cookie-box:20180305232608p:plain:w60

それは146~147ページに説明がありますが、Granger因果性はその定義から「その変数があった方がよい予測ができる」でしかないです。Granger因果性の存在が確かめられても、通常の意味の因果関係、つまり、「春名さんの収入を変化させると、春名さんのドーナツ消費量も変化する」を抑えたわけにはならないんです。因果関係がなくてもGranger因果性の存在が確認されてしまうかもしれませんので。なので、複数時系列間の相互作用を別の切り口で調べる方法として、147ページにインパルス応答が挙げられていますね。

f:id:cookie-box:20180305231302p:plain:w60

そういうことか。…161ページからは、ARCH・GARCH…また新しいのが出てきた…。

f:id:cookie-box:20180305232608p:plain:w60

ARCHはノイズの分散を過去のノイズの大きさで回帰するようなモデルですね。ここまでずっとノイズ項の分散は  \sigma^2 で固定でしたが、もはやこれも時間変化するということです。GARCHはノイズの分散を過去のノイズの大きさ及び過去のノイズの分散でも回帰します。過去のノイズの正負を考慮した拡張モデルも紹介されていますね。

f:id:cookie-box:20180305231302p:plain:w60

その GJR モデルって実質、過去のノイズの大きさへの回帰係数を、過去のノイズの正負によって別の値に切り替えてるんだよな。それだと 0 で不連続になるし、結構適当な対応だなって思うんだけど、これでも強力ってことなのかな。…ともかくやっと本の前半終わった!!

(ノート7があれば)つづく