矩陣和向量組和線性方程組之間的關係是什麼?


對於這樣的線性方程組:

egin{cases} 2x+3y=1\ x+y=2end{cases}

求解其答案的幾何意義是:

那麼可以想像,解有以下三種情況:

  • 兩條直線有一個交點,方程組有一個解
  • 兩條直線共線,方程組有無數解
  • 兩條直線平行,方程組無解

如果從矩陣、向量的角度來看待這個問題,我們會得到一個全新的解題思路。

1 通過矩陣求解線性方程組

文章開頭提到的線性方程組:

egin{cases} 2x+3y=1\ x+y=2end{cases}

我們可以寫成矩陣、向量的形式:

egin{bmatrix} 2  3 \ 1  1 end{bmatrix}egin{bmatrix} x \ y end{bmatrix}=egin{bmatrix} 1 \ 2 end{bmatrix}

A=egin{bmatrix} 2  3 \ 1  1 end{bmatrix}vec{x_{}}=egin{bmatrix} x \ y end{bmatrix}vec{b_{}}=egin{bmatrix} 1 \ 2 end{bmatrix} ,我們就得到了更一般的形式:

Avec{x_{}}=vec{b_{}}

要求解就要弄清楚這個矩陣方程的集合意義。

讓我們從線性空間說起。

1.1 線性空間

先忘掉坐標系,我們從一片空白開始:

我們隨便選個點作為原點,以此原點作兩個單位正交的向量(因為是二維的,所以兩個就夠了):

平面上的某個點,可以這樣表示:

我們簡化一下,這就變為了坐標的形式:

整個二維平面上的點,顯然都可以通過 avec{i_{}}+bvec{j_{}},ain mathbb {R},bin mathbb {R} 的方式來表示。用數學的語言就是,整個二維平面是 vec{i_{}},vec{j_{}}張成的線性空間

為了可視化張成的線性空間,我用灰色網格來表示,網格的交點就是整數坐標:

如果 vec{i_{}},vec{j_{}} 不正交,長度也不相等,那麼依然張成整個二維空間,只是網格有所不同(坐標有所不同):

如果 vec{i_{}},vec{j_{}} 在一條直線上,那麼就只能張成一維空間:

當然,如果 vec{i_{}},vec{j_{}} 都是原點,那麼就只能張成零維空間了,也就是點。

1.2 Avec{x_{}} 的幾何意義

我們把 vec{x_{}} 在單位正交基 vec{i_{}},vec{j_{}} 下畫出來:

為了方便展示,我舉個具體的 A ,就用旋轉矩陣吧( A=egin{bmatrix} cos(	heta )  -sin(	heta ) \ sin(	heta )  cos(	heta ) end{bmatrix} )。

那麼 Avec{x_{}} 的效果是讓 vec{x_{}} 發生旋轉:

仔細觀察下,變換開始時:

變換結束後:

可以觀察到,整個變換過程是, vec{x_{}}vec{i_{}},vec{j_{}} 為基的坐標並沒有發生變換,而是 vec{i_{}},vec{j_{}} 這兩個基發生了旋轉,導致 vec{x_{}} 發生了變換。

這就好比坐公交車:

我相對公交車沒有移動,但因公交車移動了,我的位置還是發生了變化。

整個移動過程用公交車這個比喻來描述,就是這樣的:

回到數學上來, A 就是這輛公交車,公交車的移動取決於 A 的列向量:

1.3 Avec{x_{}}=vec{b_{}} 的幾何意義

Avec{x_{}}=vec{b_{}} 就是說,通過 Avec{x_{}} 運動到 vec{b_{}}

借用公交車的比喻,就是在 vec{x_{}} 上車,通過公交車到達了 vec{b_{}}

1.4 矩陣的秩與解

這個公交車有點古怪,並非某個點上車都能到達 vec{b_{}} ,我們的任務就是找到那些可以到達 vec{b_{}}vec{x_{}}

這就需要研究這個公交車的站牌了:

從數學上說,公交車的站牌是由 A 的列空間決定的,讀懂了列空間就讀懂了站牌。

1.4.1 滿秩

比如,旋轉矩陣 A=egin{bmatrix} cos(	heta )  -sin(	heta ) \ sin(	heta )  cos(	heta ) end{bmatrix} 的列空間是二維的:

即整個二維空間上的點都在這個公交車 A 的行駛範圍內,那麼:

並且我們還可以觀察到,只有唯一一個點上車才可以到達 vec{b_{}}

列空間的維度實際上就是矩陣的秩(參看 這個回答 ),所以我們得到第一個數學結論,滿秩的矩陣,有唯一的解。

1.4.2 不滿秩

再比如,這個矩陣 A=egin{bmatrix} 1  2 \ 1  2 end{bmatrix} 的列空間是一維的:

那麼,假如:

這也就是無解的意思。

可以觀察出來, egin{bmatrix} vec{i_{}}  vec{j_{}} end{bmatrix} 的秩一定小於 egin{bmatrix} vec{i_{}}  vec{j_{}}  vec{b_{}} end{bmatrix} ,那麼可以得到第二個數學結論, egin{bmatrix} vec{i_{}}  vec{j_{}} end{bmatrix}的秩 &< egin{bmatrix} vec{i_{}}  vec{j_{}}  vec{b_{}} end{bmatrix} 的秩,那麼無解。

如果 vec{b_{}}A 的列空間中,那麼:

整條綠色線段上的點都會到達 vec{b_{}} 點(多一句嘴, vec{b_{}} 不一定會經過 A 到達 vec{b_{}} 點),這就是有無數個解。

這個可以直觀去想像,空間由二維壓縮到一維,那麼必然有無數多個點被壓縮到同一個點上去。

至此得到第三個數學結論: egin{bmatrix} vec{i_{}}  vec{j_{}} end{bmatrix} 的秩 = egin{bmatrix} vec{i_{}}  vec{j_{}}  vec{b_{}} end{bmatrix} 的秩,並且不滿秩,那麼有無數多個解。

1.5 小結

我們得到三個數學結論:

  • 滿秩的矩陣,有唯一的解
  • egin{bmatrix} vec{i_{}}  vec{j_{}} end{bmatrix} 的秩 &< egin{bmatrix} vec{i_{}}  vec{j_{}}  vec{b_{}} end{bmatrix} 的秩,無解
  • egin{bmatrix} vec{i_{}}  vec{j_{}} end{bmatrix} 的秩 = egin{bmatrix} vec{i_{}}  vec{j_{}}  vec{b_{}} end{bmatrix} 的秩,無數解

經過我們上面的分析,應該還是挺直觀的吧。

繼續推下去很容易得到解的結構、零空間、解空間這些概念,這裡就不推下去了,拋磚引玉,希望大家集思廣益。


求解線性方程組的過程中
才慢慢產生矩陣等等抽象的東東的。

比如線性方程組 Ax=b
把A表示成(a1,a2,...an)等列向量。x表示成(x1,x2,...,xn)的轉置
那麼線性方程組就表示成 x1*a1 + x2*a2 +...xn*an = b
可以看到左邊是一個向量組的線性表示。
而求解x則是尋找b在(a1,a2,...an)下的一個線性表示。

假設α代表其中的一個線性表示,β代表另外一個線性表示。(也就是說他們都是方程的解)
那麼有Aα=Aβ = b, 既a1*α1+a2*α2+...an*αn=a1*β1+a2*β2+...an*βn
變成a1(α1-β1)+a2*(α2-β2)+...an*(αn-βn)=0
也就是說α與β的差是Ax=0的一個解。α與β則構成了一個關於Ax=0的一個等價關係

求解Ax=b的過程就變成了Ax=0的過程和一個特解的過程。
關於Ax=0
表示成x1*a1 + x2*a2 +...xn*an=0
這又構成了向量空間的線性相關或者無關的知識。以及尋找一組基等等。


一個nxn線性方程組的解在空間里看就是R^n的n個平面的交點。換種思維看,x的係數看作向量&。求這個線性方程組的解就變成了如何組合才能把這些係數構成的向量組合成目標向量。
一種是n個平面的交點,另一種是n個向量的線性組合。


我們假設線性方程組對應的矩陣是

egin{bmatrix} a_1  b_1 \ a_2  b_2 end{bmatrix} egin{bmatrix} x\ y end{bmatrix} = egin{bmatrix} c_1\ c_2 end{bmatrix}

然後我們定義直角坐標系A,原點為 O(0,0) ,然後在坐標系A中繪製點 vec{i}(a_1,a_2),vec{j}(b_1,b_2),P(c_1,c_2)

我們以以坐標系A的原點為原點, vec{i}(a_1,a_2) 為x軸單位長度, vec{j}(b_1,b_2) 為y軸單位長度,建立坐標系B,接著我們計算 P(c_1,c_2) 在坐標系B中的x坐標和y坐標,即為答案。


各種關係教材基本都寫了。mnr關係,r和相關無關和方程組解的關係。但是一定記住矩陣是數有序排列,有橫向和縱向,向量組是向量的一維排列,線性方程組是方程組,之後各種關係才有意義。可能這三個在實際中應用的領域不一樣吧,本質基本是一回事,可以看作是三中處理思路或者角度。但是三者的具體形態是不同的。本科階段一般來說學習的內容可以歸結為在特定形態下的性質,多種形態之間的關係。特徵值、向量,相似對角化和二次型也有這個意味。不同形態或者思路下的性質,不同形態不同性質命題的等價關係。特徵、二次型部分內容有新的,也有可用於前面的,所以可以把這些內容看做更廣泛的適用的內容。看到個矩陣時不光要考慮到對應向量組和方程組的性質,也要盡量分析pqr,特徵方程,特徵值。


矩陣與線性方程有以下關係:

一.矩陣是線性方程組的表示
什麼是線性方程?

  1. 滿足scaling,即f(alpha x)=alpha f(x)
  2. 滿足superposition,即f(u+v)=f(u)+f(v)

對於矩陣A,滿足scaling和superposition,所以用矩陣A表述的方程組f(x)=Ax是線性方程組的緊密表示。(矩陣這種一行式子的比線性方程組那好幾行式子的不知美觀多少)

二.利用矩陣對線性方程組進行方便的求解
利用矩陣可以對線性方程組進行方便快速地求解。


推薦閱讀:

為什麼matrix(矩陣)不可以相除?
任意一個只含有0,1的矩陣,可不可以只通過矩陣變換,使得所有的元素均變為1?
如何使用Krylov方法求解矩陣的運算尤其是逆?
n階方陣中可逆矩陣和不可逆矩陣哪個多?
矩陣的乘積有什麼代數或具體應用意義?

TAG:數學 | 線性代數 | 矩陣 | 高等代數 |