参考文献: データ同化入門 (予測と発見の科学) | 樋口 知之 |本 | 通販 | Amazon
文字の置き方と表式をだいたい上の本に準拠していますが、違うこともあります。導出の仕方は上の本とは異なります。間違っていたらご指摘ください。今回はカルマンフィルタの話しかないです。キャラクターに元ネタはないです。
カルマンフィルタとその仲間たちみたいな何とかフィルタって色々ありますよね。
その辺ってなんかわかった気になってしまいませんか? 線形でベイジアンだったらちゃんと解けばよくて、そうじゃなかったら現在の の周りで1次形近似したり、 の分布を粒子のアンサンブルで近似すればいいんだ、って感じで…。
なんで!? いうほどわかった気にならないよ?
というか、そもそも何をしたかったのかもよくわからなくなってしまって…。
目的は状態の推定だよね!?
よく ARIMA のような伝統的な時系列モデルから状態空間モデルへ、って説明されますけど、話が変わってる気がするんですよね。ARIMA では AR や MA の各次数の係数を求めて、状態空間モデルは状態の分布を推定していくんですよね。なんか話が逆になってませんか? モデル に対して時系列データ を所与として の係数を求めたいのか、 の形は所与として を推定したいのか…。
なるほど…。じゃあ、このブログの2018年4月23日の記事にある、「(状態空間モデルで)もし『状態』が観測される変数そのもので、『観測モデル』が恒等写像だったら(伝統的な時系列モデルと)一緒の構図になる」というのは対応がおかしかったんですね。より正しくは、「もし『状態』が ARIMA モデルの係数(及び必要なステップだけの過去から現在までのノイズや観測値)で、『観測モデル』がそれらの線形和(ARIMA モデルの形)だったら一緒の構図になる」ですね。観測モデルは観測といっても日常的な意味のように「観測時に入り混じる誤差を考慮したモデル」ではなく、「不確かな変数を知覚できる数値に変換するモデル」なのに、筆者はそこを踏み外して、思考停止でシステムモデルに ARIMA を代入していたんですね。
う、うん。たぶんそうだね…。あくまでそういう状態空間モデルにすれば ARIMA と「係数を求めたい」という目的が大雑把にそろうというだけで、実際には ARIMA モデルの方では逐次的に係数の分布を更新してはいかないと思うけどね。あと、もしそのように修正する前の元の文章の立場に立つなら、「この時系列データはこの係数のARIMAモデルで時間発展する」ということの方に絶対の確信があって、知覚された時系列データがそれに従っていないならそっちがあやしい、観測ノイズによって真の値とずれているんだろう、真の値が知りたい、という姿勢にはなるね。
不確かなものを推定したいという目的はわかったと思います。では早速各種フィルタについてちゃんと追って行きたいと思うんです。まず一般的に、一期先予測とフィルタリングは以下の式で表せます。
(一期先予測分布)
(フィルタ分布)
また端折ったね…。まず前提として、ここでは時刻 までの観測値 が得られたもとでの状態の分布 を所与とするんだね。かつ、時刻 の状態を と固定したもとでの次の時刻の状態の分布 も計算できるとする。これはシステムモデルを決めておきなさいってことだね。これらがわかれば、一期先予測の式は の分布にわたって次の時刻の がどうなるかの分布を積分するだけ。それで次にフィルタの式は、現時点までの観測値 が出そろったもとでの状態の分布 はどうなっているか、ということだけど…これは観測モデル とさっきの一期先予測の式 の積からベイズの定理により求まるね。ただ、単にこれらの積だと確率分布が正規化されないから、 で割る必要がある。これは、 は を の分布にわたって積分すれば求まる。あと、ここまで暗に、下図のグラフィカルモデルで表される従属構造が仮定されていることに注意が必要だね。つまり、 及び が成り立つ。マルコフ性ともいうね。そうじゃなきゃ上の式にならない。
あ、はい、色々飛ばしてました…補足ありがとうございます。それでまずカルマンフィルタの導出です。ここからは、システムモデルと観測モデルがそれぞれ以下のようにかけると仮定しています。
上式に出てくる以下の文字は以下のような次元のベクトルや行列です。
このうち と は正規ノイズの分散共分散行列ですね。それで、 が最初から決まっていない、確率変数です。目的は、 の分布をトラッキングすることです。
うん、観測値より状態の次元の方が大きいなら は横長の、逆なら縦長の行列になるね。
そうですね。それで、先に結論を書きます。
を仮定すると、
(一期先予測分布)
(フィルタ分布)
但し、
が成り立ちます。時刻 までの観測値 が得られたもとで推定されている状態の分布がガウシアンならば、一期先予測もガウシアンであり、さらに時刻 のフィルタ分布もガウシアンであるということです。かつ、その一期先予測とフィルタ分布の平均ベクトルと分散共分散行列は上式のように1つ手前の平均ベクトルや分散共分散行列の式として陽に書き下せます。
有名な結論だね。
でもどうしてこういうことになるのか。
一期先予測分布が導出できたね。フィルタ分布はベイズの定理を使うとどうなる? さしあたり正規化因子は考えなくていいよ。
ベイズの定理をつかうと、
ここからどうすれば…。
…ごめん寝てた。
なんで寝るの!? 部長のために式展開したのに!
部活動予算でどんなマシン買う気なの!? 運動部じゃないんだからそんな予算下りないよ?