矩陣的指數函數到底說的是個啥?

如題,

egin{align*}
e^{At}: = I+At+frac{left(At
ight)^{2}}{2!}+cdots+frac{left(At
ight)^{n}}{n!}+cdots\
impliesfrac{d}{dt}left(e^{At}
ight) = A+A^{2}t+frac{A^{3}t^{2}}{2!}+cdotsfrac{A^{n}t^{n-1}}{left(n-1
ight)!}+cdots\
= Aleft(I+At+frac{left(At
ight)^{2}}{2!}+cdots
ight)=Ae^{At}
end{align*}

我就不理解矩陣的指數函數是個啥。。。

比如A=left(egin{array}{cc}
1  1\
1  1
end{array}
ight),那麼e^A是個啥?


謝邀.

首先說exp的計算吧,很簡單,對於(實或復)矩陣A,先把A化成Jordan標準型,也就是

A=PJP^{-1}

這樣的話,按照定義,exp (A)=Pexp (J) P^{-1}. 因此只要計算Jordan標準型的exp即可.

而Jordan標準型分塊對角的,每一塊是一個Jordan塊,因此只要計算Jordan塊的exp即可.這裡計算一下就好了.

expegin{pmatrix}lambda10cdots00\0lambda1cdots00\ cdots\000cdotslambda1\000cdots0lambdaend{pmatrix}=
egin{pmatrix}e^lambdae^lambda/1!e^lambda/2!cdotse^lambda/(n-1)!e^lambda/n!\0e^lambdae^lambda/1!cdotse^lambda/(n-2)!e^lambda/(n-1)!\ cdots\000cdotse^lambdae^lambda/1!\000cdots0e^lambdaend{pmatrix}

Rk. 事實上,因為tA=P(tJ)P^{-1},時常也會直接計算exp(tJ),那麼對於Jordan塊,同樣可以計算

expegin{pmatrix}tlambdat0cdots00\0tlambdatcdots00\ cdots\000cdotstlambdat\000cdots0tlambdaend{pmatrix}=
egin{pmatrix}e^{tlambda}e^{tlambda}t/1!e^{tlambda}t^2/2!cdotse^{tlambda}t^{n-1}/(n-1)!e^{tlambda}t^n/n!\0e^{tlambda}e^{tlambda}/1!cdotse^{tlambda}t^{n-2}/(n-2)!e^{tlambda}t^{n-1}/(n-1)!\ cdots\000cdotse^{tlambda}e^{tlambda}t/1!\000cdots0e^{tlambda}end{pmatrix}

上面的計算是因為每個Jordan塊可以寫成lambda I+J(0),由於IJ(0)可交換,因此

exp(J(lambda))=exp(lambda I)exp(J(0))

J(0)是冪零的,並且J(0)的k次方很容易看出來,所以很好算的.

我說清楚如何計算了嗎?

那麼好,現在說一些理解的問題,在數上面的exp是自然的來自於這樣一個微分方程:

egin{cases}dot x=lambda x\x(0)=x_0end{cases}

其解為x(t)=e^{tlambda}x_0.

而在向量上面,這樣的微分方程也是有的,也就是

egin{cases}dot x=A x\x(0)=x_0end{cases}

其中x是向量值函數,x_0是向量. 那麼類似數上面的東西,我們完全可以把這個裡面的解涉及的關於A的那個運算也叫做exp.

但是個人感覺,一個更好的理解方式是函數演算(functional calculus). 這裡直接說復的情形了. 很簡單,就是把冪級數推廣到矩陣上. 矩陣可以加可以乘,而且關鍵的是,可以取極限,因此可以定義冪級數,也就是把sum a_nx^n這種東西推廣到矩陣上,定義sum a_n X^n,其中X是矩陣. 完全類似,可以利用矩陣的範數討論冪級數的收斂問題,類似於用複數上的模去討論收斂半徑. 用這種方法,可以把各種我們能想到的解析函數推廣到矩陣上,例如對於矩陣X,完全可以定義exp Xcos Xsin X,還有ln(I+X)frac{1}{X-I}等等等. (前面那些收斂半徑是正無窮,但後面兩個就不行了.) 用函數演算可以干很多很多好玩的事情,在此不表……

btw 一般的函數演算是用Cauchy積分定義的,因為那個冪級數未必要在某個圓盤上都有定義,只要在X的譜點附近定義就可以了,而後者的形狀未必是規則的.


e^x=lim_{h	o0}left(1+hx
ight)^{frac{1}{h}} 類似,對矩陣指數函數也有e^A=lim_{h	o0}(I+hA)^{frac{1}{h}}。一個例子:

考慮常微分方程

frac{mathrm{d}mathbf{x}}{mathrm{d}t}=Amathbf{x}

我們知道解為mathbf{x}(t)=e^{At}mathbf{x}(0) 。如果用前向歐拉法並以h為步長,則對應迭代為

mathbf{x}_{n+1}=mathbf{x}_n+hAmathbf{x}_n=(I+hA)mathbf{x}_nLongrightarrow mathbf{x}(t)=(I+hA)^{frac{t}{h}}mathbf{x}(0)overset{h	o0^+}{longrightarrow}e^{At}mathbf{x}(0)

如果用後向歐拉法並同樣以h為步長,則對應迭代為
mathbf{x}_{n+1}=mathbf{x}_n+hAmathbf{x}_{n+1}Longrightarrow mathbf{x}_{n+1}=(I-hA)^{-1}mathbf{x}_nLongrightarrow mathbf{x}(t)=(I-hA)^{-frac{t}{h}}mathbf{x}(0)overset{h	o0^+}{longrightarrow}e^{At}mathbf{x}(0)

(即mathbf{x}(t)=(I+hA)^{frac{t}{h}}mathbf{x}(0)overset{h	o0^-}{longrightarrow}e^{At}mathbf{x}(0)


你已經寫好了關於矩陣的指數函數的定義了,就是那個第一個表達式。

e^{At}:  =  I+At+frac{left(At
ight)^{2}}{2!}+	ext{...+}frac{left(At
ight)^{n}}{n!}+...

先把那個t忽略掉,這個是指數函數的定義。跟我們定義在實數(複數)域山的指數函數沒有什麼不同,就是將矩陣映射為矩陣而已。

樓上已經有人貼了計算這個映射的象的技巧了,在此就不贅述了。


根據定義就可以了,如果A=egin{pmatrix}11\11end{pmatrix},那麼

egin{align*}
e^{A}=I+A+frac{A^2}{2!}+frac{A^3}{3!}+cdots\
=egin{pmatrix}10\01end{pmatrix}+egin{pmatrix}11\11end{pmatrix}+frac{1}{2}egin{pmatrix}22\22end{pmatrix}+frac{1}{6}egin{pmatrix}44\44end{pmatrix}+cdots\
=egin{pmatrix}1+1+frac{2}{2}+frac{4}{6}+cdots0+1+frac{2}{2}+frac{4}{6}+cdots \
0+1+frac{2}{2}+frac{4}{6}+cdots 1+1+frac{2}{2}+frac{4}{6}+cdots end{pmatrix}
end{align*}

最後得到一個2	imes 2的矩陣,因為1+1+frac{2}{2}+frac{4}{6}+cdots 是一個收斂的實數級數(根據比較判別法就可以了),所以它是一個實數,但我們一般並不關心這個具體的數值。具體計算可以見 @王箏 的方法。


其實就是一種矩陣冪級數的記號,仿照實數或複數的情況。然後,發現這樣的記號滿足少數簡單的指數函數的運算性質。矩陣函數都是這樣推廣來的。能這樣寫,主要是基於矩陣自乘是可交換的,以及收斂性。

但是常用的很多冪指數函數的性質對矩陣情況是不成立的,因為不同矩陣相乘不具有交換性。


用李群李代數的觀點看,矩陣A相當於給出Gl(n)上的左不變向量場(在可逆方陣g處為)d/dt(g*exp(At))|t=0,那麼exp(At)相當於過單位元I處的一條積分曲線,相當於左不變向量場積出來的單參數子群。這樣看幾何一點。


題目太抽象,你問的是exp(A) 裡面的A是個矩陣的話整個表達式的含義么?

當A是個有限方陣時,A中的元素是取自C或者R,(完備拓撲域),可定義A的模(norm),使得,所有方陣的集合構成一個線性完備拓撲空間,也叫巴拿赫空間(Banach),然後exp(A) 定義為相應的級數,如果級數依照前面定義的模收斂那麼這個表達式是有意義的,結果是一個矩陣


數學上前面應該已經解釋的差不多了,我可以補充一個實際用到矩陣指數的例子。文獻可戳

http://iopscience.iop.org/0034-4885/65/2/203/pdf/0034-4885_65_2_203.pdf

簡單說來就是如果有一個處於平衡態的化學反應

ALeftrightarrow B

A到B的反應速率常數為k_{ab} ,B到A的反應速率常數為k_{ba} ,A,B各自的擴散係數均為D

那麼對於相對整個反應體積(比如一個100mL燒杯)而言無限小的一個局部範圍,其物質A與物質B的局部濃度漲落的方程組可以寫為:

frac{partial delta C_{a} }{partial t}=-DDelta delta C_{a}-k_{ab}C_{a}+k_{ba}C_{b}

frac{partial delta C_{b} }{partial t}=-DDelta delta C_{b}+k_{ab}C_{a}-k_{ba}C_{b}

寫成矩陣形式即為

frac{partial }{partial t} left[egin{array}{ccc} delta C_{a}\delta C_{b}\ end{array} 
ight]=left[ egin{array}{ccc}  -D-k_{ab}k_{ba}  \k_{ab}-D-k_{ba}  \ end{array} 
ight]left[ egin{array}{ccc}  C_{a}\ C_{b}\ end{array} 
ight]

求解這個方程,就會遇到矩陣函數,求解過程完全反映前面 王箏 的答案,也可以從這個具體的例子中體會矩陣指數的意義。


我們來弄清楚兩個問題:

第一矩陣函數的定義是什麼?

第二矩陣函數的微分的定義是什麼?

這兩個問題清楚後,我們就會明白矩陣的指數函數及其微分是什麼了。

矩陣的函數定義為矩陣中每一個元素的函數:即

f(A)_{ij}=f(A_{ij})

例如A=left[
 egin{matrix}
   1  0 \
   0  1  end{matrix}
  
ight],f(A)=2A=2*(A_{ij})=left[
 egin{matrix}
   1*2  0*2  \
   0*2 1*2
  end{matrix}
  
ight]=left[
 egin{matrix}
  2 0  \
   02  end{matrix}
  
ight]

矩陣微分的定義為矩陣中每個元素的微分:即

(frac{partial A}{partial x})_{i,j}=frac{partial A_{ij}}{partial x}

例如A=left[
 egin{matrix}
   e^{x}  2x \
   0  1  end{matrix}
  
ight](frac{partial A}{partial x})_{i,j}=(frac{partial A_{i,j}}{partial x})=left[
 egin{matrix}
   frac{partial e^x}{partial x}  frac{partial 2x}{partial x}  \
   frac{partial 0}{partial x} frac{partial 1}{partial x}  end{matrix}
  
ight]=left[
 egin{matrix}
  e^{x} 2  \
   00  end{matrix}
  
ight]

知道了矩陣函數及其微分的定義後,題主關於矩陣的指數函數的定義與形式迎刃而解。


我記得上面回答的都是時域的方法,

求fan=exp(F*t),還有一個頻域方法是

L-1是拉普拉斯反變換

(上面這個是卡爾曼濾波中連續方程離散化的式子)


本質是矩陣冪函數的擴充,你可以把泰勒展開中的某某次方想像成矩陣連乘即可。


具體的指數函數都可以從指數映射來考慮。

對於一般實線性群GL(n,R),關於矩陣乘法是個李群,I是其中的單位元,它的李代數是gl(n,R)是n×n實矩陣全體。

對於任意X∈gl(n,R)

設exp_{X}(t)是它的積分曲線,

可以推得

(d(exp_{X})/dt)_{t=s}=exp_{X}(s)X

(d(exp_{X})/dt)_{t=0}=X

這兩條性質,

我們定義這個映射為關於矩陣的指數函數,並可由此推出它的級數形式的表達式。


你需要閱讀《工程矩陣》中矩陣函數一節


誰能告訴我為什麼指數矩陣的值就是指數矩陣的軌跡嗎,怎麼證明呢


推薦閱讀:

矩陣和向量組和線性方程組之間的關係是什麼?
為什麼matrix(矩陣)不可以相除?
任意一個只含有0,1的矩陣,可不可以只通過矩陣變換,使得所有的元素均變為1?
如何使用Krylov方法求解矩陣的運算尤其是逆?
n階方陣中可逆矩陣和不可逆矩陣哪個多?

TAG:數學 | 微積分 | 線性代數 | 矩陣 | 高等代數 |