雑記: システムの可制御性・可観測性の話

おかしい点がありましたらご指摘いただけますと幸いです。

参考文献

  1. 線形システム論
    • 可制御性・可観測性の講義資料がありました。
  2. 可制御性・可観測性 - 初級Mathマニアの寝言
    • この方の記事のように正準分解形までいきたかったのですがはるか手前で力尽きました。


突然ですが、A \in \mathbb{R}^{n \times n}, \, t\in \mathbb{R} に対し、 \exp(At) を以下のように定義することにします。つまり、 \exp(At) \in \mathbb{R}^{n \times n} です。At に依存しないことにします。
  \displaystyle \exp(At) \equiv I + At + \frac{1}{2} A^2 t^2 + \frac{1}{3!} A^3 t^3 + \cdots + \frac{1}{k!} A^k t^k + \cdots
するとこうなります。\mathcal{o}(\cdot) はスモールオーで、R(t) は各成分が t より速く 0 に収束する n \times n 行列です。
  \displaystyle \exp \bigl(A(t_0 + t)\bigr) = I + A(t_0 + t) + \frac{1}{2} A^2 (t_0 + t)^2 + \frac{1}{3!} A^3 (t_0 + t)^3 + \cdots+ \frac{1}{k!} A^k (t_0 + t)^k + \cdots
  \displaystyle = \exp(At_0) + At + \frac{1}{2} A^2 (2 t_0 t + t^2) + \frac{1}{3!} A^3 (3 t_0^2 t + 3t_0 t^2 + t^3) + \cdots + \frac{1}{k!} A^k \bigl(k t_0^{k-1} t + \mathcal{o}(t) \bigr) + \cdots
  \displaystyle = \exp(At_0) + A \exp(At_0) t + R(t)
なので、\exp(At_0) という行列の各成分の値は、t_0 の部分を t_0 からほんの少しの t だけずらすと、ずらした分の  A \exp(At_0) (の同じ成分)倍だけ値がずれます(微分)。各成分の微分を束ねてしまってこうかきます。
   \displaystyle \frac{d}{dt} \exp(At) =  A \exp(At)
このことを利用すると、もし下のようにひとりで勝手に変化していく x(t) \in \mathbb{R}^n があったとき、その正体が  x(t) = \exp \bigl( A(t-t_0) \bigr) x_0 であるとわかります(ただし、初期状態が x(t_0) = x_0 であったとしました)。
ひとりで勝手に変化していく x(t)
 \displaystyle \; \; \frac{d}{dt}x(t) = A x(t)
しかし、これからやりたいことは、x(t) が勝手に変化するのを放っておくのではなく、これに何かを入力したり、何か出力を取り出したりすることです。特に、入力 u(t) を加えて x(t) を思い通りに制御できるかとか、出力 y(t) を観測して x(t) を特定できるかとかに興味があります。
何かを入力すると何かが出力されるもののことを「システム」というらしいです。が、それだけだとシステムがどんな性質をもつかについて考察できないし、入力や出力とは何なのかもよくわからないので、ここではもっぱら方程式によるモデルのことをシステムと考えます。あと、ここで考えるシステムには何か放っておいてもひとりで勝手に変化していく「状態」というものがあって、この状態は「自身の現在の状態」の線形変換と「現在の入力」の線形変換を足し合わせた速度で変化します。そして状態の線形変換が出力されてきます。そういうシステムを考察することにします。逆に、勝手に変化していく「状態」を中で飼っていなければ明らかに好きなように制御できるのでそんなシステムを考察する必要はないわけです。
(線形で時不変な)連続時間システム
 \begin{cases} \displaystyle \frac{d}{dt}x(t) = A x(t) + B u(t) & \\ y(t) = Cx(t) & \end{cases}
ここで、x(t) \in \mathbb{R}^n, \, u(t) \in \mathbb{R}^r, \, y(t) \in \mathbb{R}^m, \, A \in \mathbb{R}^{n \times n}, \, B \in \mathbb{R}^{n \times r}, \, C \in \mathbb{R}^{m \times n} とし、x(t) を状態、u(t) を入力、y(t) を出力とよぶことにします。入力は状態そのものでなく状態の速度と線形の関係にありますが、現実ではこういうことはわりと(?)あります。コンデンサにある電位差を生じさせたいときにどう電流を流せばいいかや、ダンパを介してぶら下がった重りをある高さまで変位させるのにどう力を加えればいいかといったケースがそうです。そんな風に状態をぬるっと変えることができずじわじわ変えていくしかない場合はあります。
なお、入力 u(t) がある場合の状態を解くと以下のようになります(証明略)。
   \displaystyle x(t) = \exp \bigl( A(t-t_0) \bigr) x_0 + \int_{t_0}^t \exp \bigl(A(t - \tau)\bigr) Bu(\tau)d\tau

ここから本題ですが、システムの「可制御性」と「可観測性」は以下のように定義されます(お手元の本により異なる可能性があります)。
可制御性
任意の時刻 t_0, \; t_1 \, (t_0 < t_1) 及び任意の状態 x_0, \; x_1 に対して、x(t_0)=x_0 であったときに x(t_1) = x_1 に到達させる入力 u(t)\, (t_0 \leqq t \leqq t_1) が存在するならば、このシステムは可制御であるという。
可観測性
任意の時刻 t_0, \; t_1 \, (t_0 < t_1) に対して、入力 u(t)\, (t_0 \leqq t \leqq t_1) 及び出力 y(t)\, (t_0 \leqq t \leqq t_1) が与えられたとき、初期状態 x(t_0)=x_0 を一意に特定できるならば、このシステムは可観測であるという。
可観測性は状態 x(t)\, (t_0 \leqq t \leqq t_1) を一意に特定できる、といっても同じですが、それは初期状態 x(t_0)=x_0 を一意に特定できることと同じです。
可制御性や可観測性がそう定義されるのはいいんですが、どんなときにシステムが可制御や可観測になるのかよくわかりません。先に結論を述べると、可制御性については以下が成り立ちます。
可制御性の必要十分条件
以下の4つの条件は同値である。
  1. システムが可制御である。
  2.  \displaystyle V \equiv \Bigl[ B \; AB \; A^2 B \; \cdots \; A^{n-1} B \Bigr] なる  n \times nr 行列 V のランクが n(フルランク)である。
  3.  \displaystyle W(t_0, t_1) \equiv \int_{t_0}^{t_1} \exp (-At) B B^\top \exp (-A^\top t) dt なる行列 W(t_0, t_1) が任意の t_0, \; t_1 \; (t_0 < t_1) で正則である。
  4.  V^\ast(\lambda_i) \equiv \Bigl[ \lambda_i I - A \; B\Bigr] なる  n \times (n+r) 行列 V^\ast(\lambda_i) のランクが n(フルランク)である。
上の V を可制御性行列、W(t_0, t_1) を可制御性グラミアンというらしいです。
これを証明します。ここで、時刻 t_1 における状態は以下のようにかけることに注意します。システムが可制御であるということは、都合のいい u(t) を選べばこの式を任意の値にできるということです。
   \displaystyle x(t_1) = \exp \bigl( A(t_1-t_0) \bigr) x_0 + \exp(A t_1) \int_{t_0}^{t_1} \exp (- A\tau) Bu(\tau)d\tau
W(t_0, t_1)u(t)=B^\top \exp (-A^\top t) x_0 を入力したとき  x(t_1) = \exp \bigl( A(t-t_0) \bigr) x_0 + \exp(A t_1) W(t_0, t_1) x_0 となるような量になっているとわかります。3. はこの W(t_0, t_1)逆行列があるといっているわけです。
また、t についての積分と行列の積は交換することに注意します(行列やベクトルにうつす関数であっても積の微分公式は成り立つので、部分積分から示せます)。となると、直ちに以下が示せます。
可制御性 3. ⇒ 1.
任意の x_1 に対し \displaystyle u_1(t) \equiv B^\top \exp(-A^\top t) W(t_0, t_1)^{-1} \Bigl( \exp(-At_1)x_1 - \exp(-At_0) x_0 \Bigr) とすれば、
 \displaystyle x(t_1) = \exp \bigl( A(t_1-t_0) \bigr) x_0
   \displaystyle + \exp(A t_1) \int_{t_0}^{t_1} \exp (- A\tau) B B^\top \exp(-A^\top \tau) d\tau \cdot W(t_0, t_1)^{-1} \Bigl( \exp(-At_1)x_1 - \exp(-At_0) x_0 \Bigr)
     = \exp \bigl( A(t_1-t_0) \bigr) x_0 + \exp(A t_1) \Bigl( \exp(-At_1)x_1 - \exp(-At_0) x_0 \Bigr) = x_1
W(t_0, t_1)逆行列さえあれば x(t_1) を好きな値にできるわけです。この逆も示せます。つまり、好きに制御できるなら、W(t_0, t_1) は正則であるということです。正則でないと仮定して矛盾を導きます。
可制御性 1. ⇒ 3.
ある t_0, \; t_1 \; (t_0 < t_1) W(t_0, t_1) が正則でないと仮定すると、 \exp(At_0)W(t_0, t_1) \exp(A^\top t_0) も正則でないので、 \exp(At_0)W(t_0, t_1) \exp(A^\top t_0) x_0 = \vec{0} を満たす非ゼロベクトル x_0 \in \mathbb{R}^n が存在する。 x_0^\top \exp(At_0)W(t_0, t_1) \exp(A^\top t_0) x_0 = 0 より、 \displaystyle \int_{t_0}^{t_1} x_0^\top \exp \bigl(-A(t-t_0) \bigr) B B^\top \exp \bigl(-A^\top (t-t_0) \bigr) x_0 dt = \int_{0}^{t_1 - t_0} \bigl\| B^\top \exp \bigl(-A^\top (t-t_0) \bigr) x_0 \bigr\|^2 dt = 0 なので、 t_0 \leqq t \leqq t_1B^\top \exp \bigl(-A^\top (t-t_0) \bigr) x_0 は恒等的にゼロである。ここで、いま可制御なので、時刻 t_0x_0 であったときに時刻 t_1\vec{0} に到達させる入力 u_0(t) が存在する。よって、 \displaystyle \vec{0} = \exp \bigl( A(t_1-t_0) \bigr) x_0 + \exp(A t_1) \int_{t_0}^{t_1} \exp (- A\tau) Bu_0(\tau)d\tau より、 \displaystyle x_0 = -\int_{t_0}^{t_1} \exp \bigl( -A(\tau - t_0) \bigr) Bu_0(\tau)d\tau とかくことができる。ここで、 \displaystyle \|x_0\| = x_0^\top x_0 = -x_0^\top \int_{t_0}^{t_1} \exp \bigl(-A(\tau - t_0) \bigr) Bu_0(\tau)d\tau = \int_{t_0}^{t_1} \Bigl( - B^\top \exp \bigl( -A^\top (\tau - t_0) \bigr) x_0 \Bigr)^\top u_0(\tau)d\tau となるが、B^\top \exp \bigl(-A^\top (\tau-t_0) \bigr) x_0 は恒等的にゼロなのでこの式はゼロとなり、x_0 が非ゼロベクトルであることに矛盾。よって、任意の t_0, \; t_1 \; (t_0 < t_1)W(t_0, t_1) は正則である。
条件 2. からも W(t_0, t_1) が正則であることが示せます。
可制御性 2. ⇒ 3.
ある t_0, \; t_1 \; (t_0 < t_1) W(t_0, t_1) が正則でないと仮定すると  W(t_0, t_1) x_0 = 0 を満たす非ゼロベクトル x_0 \in \mathbb{R}^n が存在して、B^\top \exp (-A^\top t) x_0 \; (\ast) は恒等的にゼロである(1. ⇒ 3. の証明と同様)。
 (\ast)t=0 を代入して、B^\top x_0 = \vec{0}
 (\ast)1微分t=0 を代入して、-B^\top A^\top x_0 = \vec{0}
 (\ast)2微分t=0 を代入して、B^\top (A^\top)^2 x_0 = \vec{0}
 (\ast)n-1微分t=0 を代入して、(-1)^{n-1} B^\top (A^\top)^{n-1} x_0 = \vec{0}
これらの転置を横に並べて  x_0^\top \Bigl[ B \; AB \; A^2 B \; \cdots \; A^{n-1} B \Bigr] = \vec{0}^\top \; \Leftrightarrow \; x_0^\top V = \vec{0}^\top だが、x_0 は非ゼロベクトルなので、V はフルランクでない。いま、3. の否定から 2. の否定が示されたので、対偶をとると、2. から 3. が示される。
この逆も示せます。ケーリー・ハミルトンの定理を使います。
 {\rm det}(sI-A) = s^n + \alpha_1 s^{n-1}+ \cdots + \alpha_n = 0 \; \Rightarrow \; A^n + \alpha_1 A^{n-1}+ \cdots + \alpha_n I = 0
可制御性 3. ⇒ 2.
V がフルランクでないとすると、 x_0^\top \Bigl[ B \; AB \; A^2 B \; \cdots \; A^{n-1} B \Bigr] = \vec{0}^\top を満たす非ゼロベクトル x_0 \in \mathbb{R}^n が存在する。つまり、B^\top x_0 = 0, \;B^\top A^\top x_0 = 0, \; \cdots, B^\top (A^\top)^{n-1} x_0 = 0 。また、ケーリー・ハミルトンの定理より、A^nI, \; A, \; \cdots, A^{n-1} の線形結合でかけるので、
B^\top \exp(-A^\top t)x_0 = \displaystyle B^\top \left( I - A^\top t + \frac{1}{2}(A^\top)^2 t^2 - \cdots \right) x_0 = 0 となる。よって、
 \displaystyle \int_{t_0}^{t_1}\bigl\| B^\top \exp(-A^\top t)x_0 \bigr\| dt = 0 \; \Leftrightarrow \; x_0^\top W(t_0, t_1) x_0 = 0 となるが、x_0 は非ゼロベクトルなので、W(t_0, t_1) は正則ではない。いま、2. の否定から 3. の否定が示されたので、対偶をとると、3. から 2. が示される。
(可制御性の残りの ⇒ 関係の証明と、可観測性の証明は未完です。)
可観測性の必要十分条件
以下の4つの条件は同値である。
  1. システムが可観測である。
  2.  \displaystyle N \equiv \begin{bmatrix} C \\ CA \\ \vdots \\ CA^{n-1} \end{bmatrix} なる  mn \times n 行列 N のランクが n(フルランク)である。
  3.  \displaystyle V(t_0, t_1) \equiv \int_{t_0}^{t_1} \exp (-A^\top t) C^\top C \exp (-A t) dt なる行列 V(t_0, t_1) が任意の t_0, \; t_1 \; (t_0 < t_1) で正則である。
  4.  N^\ast(\lambda_i) \equiv \begin{bmatrix} \lambda_i I - A \\ C \end{bmatrix} なる  n \times (n+r) 行列 N^\ast(\lambda_i) のランクが n(フルランク)である。
上の N を可観測性行列、V(t_0, t_1) を可観測性グラミアンというらしいです。