如何直觀形象的理解方嚮導數與梯度以及它們之間的關係?

書上的公式會用來算題但是不明就裡,求大神賜教


我們先來玩一個遊戲,假如你在一座山上,蒙著眼睛,但是你必須到達山谷中最低點的湖泊,你該怎麼辦?

梯度可以幫助你完成這個遊戲。

圖片來自 Introduction to Gradient Descent Algorithm (along with variants) in Machine Learning 。

梯度和方嚮導數緊密相關,讓我們從方嚮導數開始。

1 方嚮導數

顧名思義,方嚮導數就是某個方向上的導數。

什麼是方向:

函數f(x,y) 在這個方向上的圖像:

我們知道:

函數f(x,y)A 點在這個方向上也是有切線的,其切線的斜率就是方嚮導數:

我之前在 什麼是全導數、偏導數、方嚮導數? 這個回答中,已經全面回答過什麼是方嚮導數了。感興趣可以看看。

2 梯度

很顯然,A 點不止一個方向,而是360^{circ} 都有方向:

每個方向都是有方嚮導數的:

此處有互動內容,點擊此處前往操作。

這就引出了梯度的定義:

梯度:是一個矢量,其方向上的方嚮導數最大,其大小正好是此最大方嚮導數。

定義出來了,並不複雜,但對於我而言這才是開始,因為我還有兩個疑問:

  • 為什麼所有方嚮導數中會存在並且只存在一個最大值?而不是有多個最大值、或者說沒有最大值?
  • 這個最大值在哪個方向取得?值是多少?

2.1 為什麼所有方嚮導數中會存在並且只存在一個最大值?

其實我最困惑的是梯度的存在性,你說有這麼多方嚮導數,有最大值我覺得還好理解,為什麼偏偏只有一個?

我們來看一個顯而易見的物理現象:

光滑的、筆直的玻璃上的水滴,一定會沿著玻璃滑下來,(理想情況下)滑下來的方向就是玻璃最陡峭的地方。對於筆直的平面玻璃而言,這個滑下來的方向是只有一個。

說這個幹什麼?我們回頭來看看梯度的數學定義,並且畫一下重點:

具有一階連續偏導數,意味著可微。可微意味著函數f(x,y) 在各個方向的切線都在同一個平面上,也就是切平面:

此處有互動內容,點擊此處前往操作。

所有的切線都在一個平面上,就好像剛才我說過的光滑的筆直玻璃上,某一點一定有且只有一個(梯度為0的情況除外,可以自己想想為什麼?)最陡峭的地方(因為方嚮導數是切線的斜率,方嚮導數最大也就意味著最陡峭)。

這就解決了我對於「為什麼所有方嚮導數中會存在並且只存在一個最大值」的疑問。

注意,因為這裡舉的例子是水滴往下滑,所以要說多說明一下,往下滑是梯度的反方向。因為梯度指的是增長最快的方向,而往下滑是減少最快的方向。

2.2 這個最大值在哪個方向取得?值是多少?

這個最大值的方向我們就取名為梯度方向。

最大方嚮導數的值是多少這個問題,我沒有找到特別直觀的方法來說明。我也不想給出計算步驟,要不看起來和數學書也沒啥區別。大家自己去查找計算過程吧。

2.3 方嚮導數與梯度的關係

方嚮導數與梯度的關係,我在這裡給大家一個直觀的操作感受。

先說明一下,下圖的矢量表示f(x,y)A 點處的梯度,切線是梯度方向的切線。因為我把梯度畫在了A 點處,所以我畫了一個輔助平面,這個平面和xy 平面平行:

為了方便觀察,我把切平面也畫出來了,切平面是之前的輔助平面有一根交線,這根交線很明顯平行於xy 平面:

我增加切平面、平行於xy 的平面以及兩者的交線,都是為了方便有個參照物,看出切線的陡峭的程度。

然後我們來觀察不同方向的切線和梯度方向的切線的關係(綠色是梯度以外的方向,它和梯度成 	heta 夾角):

自己動手操作以下,就很容易觀察出為什麼梯度是最陡峭的方向,以及 	heta 對方嚮導數大小的影響:

此處有互動內容,點擊此處前往操作。

2.4 總結

簡單總結下:

  • 方嚮導數是各個方向上的導數
  • 偏導數連續才有梯度存在
  • 梯度的方向是方嚮導數中取到最大值的方向,梯度的值是方嚮導數的最大值

3 完成最開頭的遊戲

對於最開頭的遊戲,我們只需要通過手感受附近梯度最大的方向,一直沿著梯度相反的方向就可以到達谷底(原理和彈珠從高處滾落最後會滾進最低處一樣):

圖片來自 Introduction to Gradient Descent Algorithm (along with variants) in Machine Learning 。

為了不誤導,我要多說一下,這個演算法叫做梯度下降演算法,我在這裡只是描述了它的演算法思想,真正實用中還需要很多的改進和優化,以及有它的局限性,這裡就不展開講了。


下面我一開始不提梯度的概念,完全根據自己的理解進行下文的梳理,一步一步推出梯度的來歷:

  • 導數

導數的幾何意義可能很多人都比較熟悉: 當函數定義域和取值都在實數域中的時候,導數可以表示函數曲線上的切線斜率。 除了切線的斜率,導數還表示函數在該點的變化率。

將上面的公式轉化為下面圖像為:

(來自維基百科)

直白的來說,導數代表了在自變數變化趨於無窮小的時候,函數值的變化與自變數變化的比值代表了導數,幾何意義有該點的切線。物理意義有該時刻的(瞬時)變化率...

注意在一元函數中,只有一個自變數變動,也就是說只存在一個方向的變化率,這也就是為什麼一元函數沒有偏導數的原因。

  • 偏導數

既然談到偏導數,那就至少涉及到兩個自變數,以兩個自變數為例,z=f(x,y) . 從導數到偏導數,也就是從曲線來到了曲面. 曲線上的一點,其切線只有一條。但是曲面的一點,切線有無數條。

而我們所說的偏導數就是指的是多元函數沿坐標軸的變化率.

f_{x} (x,y)指的是函數在y方向不變,函數值沿著x軸方向的變化率

f_{y} (x,y)指的是函數在x方向不變,函數值沿著y軸方向的變化率

對應的圖像形象表達如下:

那麼偏導數對應的幾何意義是是什麼呢?

  • 偏導數f_{x} (x_{0},y_{0} )就是曲面被平面y=y_{0}所截得的曲面在點M_{0}處的切線M_{0}T_{x}對x軸的斜率
  • 偏導數f_{y} (x_{0},y_{0} )就是曲面被平面x=x_{0}所截得的曲面在點M_{0}處的切線M_{0}T_{y}對y軸的斜率

可能到這裡,讀者就已經發現偏導數的局限性了,原來我們學到的偏導數指的是多元函數沿坐標軸的變化率,但是我們往往很多時候要考慮多元函數沿任意方向的變化率,那麼就引出了方嚮導數.

  • 方嚮導數

終於引出我們的重頭戲了,方嚮導數,下面我們慢慢來走進它

假設你站在山坡上,相知道山坡的坡度(傾斜度)

山坡圖如下:

假設山坡表示為z=f(x,y),你應該已經會做主要倆個方向的斜率.

y方向的斜率可以對y偏微分得到.

同樣的,x方向的斜率也可以對x偏微分得到

那麼我們可以使用這倆個偏微分來求出任何方向的斜率(類似於一個平面的所有向量可以用倆個基向量來表示一樣)

現在我們有這個需求,想求出u方向的斜率怎麼辦.假設z=f(x,y)為一個曲面,p(x_{0} ,y_{0} )f定義域中一個點,單位向量u =cos	heta i+sin	heta j的斜率,其中	heta 是此向量與x軸正向夾角.單位向量u可以表示對任何方嚮導數的方向.如下圖:

那麼我們來考慮如何求出u
方向的斜率,可以類比於前面導數定義,得出如下:

f(x,y)為一個二元函數,u =cos	heta i+sin	heta j為一個單位向量,如果下列的極限值存在

lim_{t 
ightarrow 0}{frac{f(x_{0}+tcos	heta ,y_{0}+tsin	heta )-f(x_{0},y_{0})}{t} } 此方嚮導數記為D_{u}f

則稱這個極限值是f沿著u方向的方嚮導數,那麼隨著	heta 的不同,我們可以求出任意方向的方嚮導數.這也表明了方嚮導數的用處,是為了給我們考慮函數對任意方向的變化率.

在求方嚮導數的時候,除了用上面的定義法求之外,我們還可以用偏微分來簡化我們的計算.

表達式是D_{u}f(x,y)=f_{x}(x,y)cos	heta   +f_{y}(x,y)sin	heta  (至於為什麼成立,很多資料有,不是這裡討論的重點)

那麼一個平面上無數個方向,函數沿哪個方向變化率最大呢?

目前我不管梯度的事,我先把表達式寫出來:

D_{u}f(x,y)=f_{x}(x,y)cos	heta   +f_{y}(x,y)sin	heta

A=(f_{x}(x,y) ,f_{y}(x,y)),I=(cos	heta ,sin	heta )

那麼我們可以得到:

D_{u}f(x,y)=Aullet I=left| A 
ight| *left| I 
ight| cosalpha (alpha 為向量A與向量I之間的夾角)

那麼此時如果D_{u}f(x,y)要取得最大值,也就是當alpha 為0度的時候,也就是向量I(這個方向是一直在變,在尋找一個函數變化最快的方向)與向量A(這個方向當點固定下來的時候,它就是固定的)平行的時候,方嚮導數最大.方嚮導數最大,也就是單位步伐,函數值朝這個反向變化最快.

好了,現在我們已經找到函數值下降最快的方向了,這個方向就是和A向量相同的方向.那麼此時我把A向量命名為梯度(當一個點確定後,梯度方向是確定的),也就是說明了為什麼梯度方向是函數變化率最大的方向了!!!(因為本來就是把這個函數變化最大的方向命名為梯度)

我的理解是,本來梯度就不是橫空出世的,當我們有了這個需求(要求一個方向,此方向函數值變化最大),得到了一個方向,然後這個方向有了意義,我們給了它一個名稱,叫做梯度(純個人理解~希望對大家理解有幫助)歡迎知友提出問題交流~

原文地址:知乎專欄


@馬同學 和 @憶臻 的答案很棒。

而關於 梯度方向為什麼是最陡的,分享一個比較直觀的點子:

1。 首先要知道 「可微」 的條件必須滿足,這意味著,我們可以在一個曲面上的任意一個點處,用一個過這個點的平面去近似那個點附近的曲面。

2。 下面的例子裡面,其實是找的梯度的反方向,也就是下降最快的方向。

好啦,開始啦:

紅色的是 X 軸 , 綠色的是 Y 軸, 藍色的是 Z 軸。

這裡並沒有畫出曲面,但請你假設 (0,0,1)(也就是 z 軸上的 C 點)這個點是曲面的上的一個點,我們要來找這個點的梯度的反方向。

假如這個點處,曲面在 X 方向上的偏倒數為 1/2, 在 Y 方向上的偏倒數為 1,那麼按照 可微 的定義,我們就可以用上面這個 淺藍色 的平面來近似 (0,0,1)這個點附近的曲面。

我要找的最陡的下降方向,就在這個平面上,也就是,從 (0,0,1)點出發,從這個平面上的某條路徑往下走是最滑的,而這條路徑在 X-Y 平面上的投影方向,就是梯度的反方向啦。

現在,我們可以來換一個角度看這個問題:

(1)最滑可以是:從 (0,0,1)出發,沿著所有的路徑往下滑,當不同路徑的投影在 X-Y 平面上長度相同時,沿著最滑的那條路徑,我們在 Z 方向上下降最多。

(2)或者,我們可以這樣看: 從 (0,0,1)出發,沿著所有的路徑我們往下滑,當都在 Z 方向上下降了同樣的高度(比如 1),最滑的那條路徑,在 X-Y 平面上的投影一定是最短的。

啊哈!上面的第二個想法會很棒,因為你會馬上發現, 假如都在 Z 方向下降了 1,那麼所有路徑下降到的最終位置都很容易找出來,它們其實就是 這個淺藍色 的平面 和 X-Y 平面相交的那條直線,我喜歡吃橙子,所以我把這條直線畫成了橙色的:

再回到上面的問題,那最滑的路徑,在 X-Y 上的投影應該是最短的。

要解決的問題變成了:點到直線的最短距離。

是的,那就是 X-Y 平面上那個 三角形 的高:

至於怎麼求出來,哈哈哈,我會覺得,我會想到兩個三角函數。

那麼,晚安吧。


2016-9-21 更新:嘗試解答評論區問題

========== 原答案開始 ==========

說說我的理解。

在一元函數中,導數就是函數隨自變數的變化率。一般一元函數的自變數使用字母x,那麼函數f(x)的導數其實就是它在x軸上的變化率。

在多元函數中,自變數是多個標量,或者理解成一個多維的向量。那麼,函數隨自變數的變化怎麼刻畫呢?一個方法,就是衡量函數在給定方向上的變化率,這就是方嚮導數。方嚮導數的特例,就是函數隨各個自變數(標量)的變化率,即函數的偏導數,也就是函數沿各個坐標軸正方向的方嚮導數。

假如一個多元函數是可微的,我要是沒記錯,它在各個方向上都有方嚮導數。那麼,函數可能在一些方向上增長的快(方嚮導數的值比較大),一些方向上增長的慢。所有這些方向中,會有一個增長最快的。梯度就是一個向量,其模為這個增長最快的速率(方嚮導數值),其方向為這個最快增長方向。

這裡發現一份課件,感覺解釋得比較清楚。第6章多元函數微分學4-10(方嚮導數 梯度)_圖文

不知道是否能對題主有所幫助。

========== 嘗試解答 @白萄 和 @巴扎勒大帝 的疑問 ==========

首先說明,我是學工科的,對數學理解其實非常有限。但既然評論區有疑問,我就嘗試回答一下。

第一F(x,y)=x^2+y^2z=x^2+y^2有什麼區別?它應該用三維空間去表示嗎?遇到z=x^2+y^2我們是應該用F(x,y)=x^2+y^2還是F(x,y,z)=x^2+y^2-z去表示呢?

我們從一元函數來說。假定 f(x)=x^2 是一個一元函數,那麼左邊的 f(x) 實際上是對右邊具體表達式的一種抽象(映射規則),即我是一個以 x 為自變數的函數,這函數也許有、也許沒有解析形式的表達方法,而且這個函數值用哪個變數表示,這裡並沒有指明。進一步,如果寫出 y = x^2,就是指把等式右邊的函數值給了 y 這個新的變數。於是在這個上下文里,y 就是因變數。這個寫法可以抽象為 y = f(x),指一個函數,x 為自變數而 y 為因變數。由於這倆變數之間建立了一種用 f 來表示的映射規則,於是可以在笛卡爾坐標系 xOy (二維)中畫出 y 關於 x 在映射規則 f 下的圖形。

將上述說法推廣到二元乃至多元函數,就可以得到上面問題的答案了。至於 F_1(x, y, z) = x^2 + y^2 - z,它就是個三元函數了。只是滿足方程 F_1(x, y, z) = 0 的所有三元組 (x, y, z) 剛好組成 z = F(x, y) 這個二元函數的圖形(三維)。

第二y=x^2微分是dy=2xdxf,線性近似是Delta y=2x Delta x,是通過切線去線性近似的,而z=f(x,y)dz=F_x^prime(x,y)dx+F_y^prime (x,y)dy(F_x^prime (x,y),F_y^prime (x,y))是梯度,線性近似形式和dz差不多。很奇怪,y=x^2通過切線近似,而z=f(x,y)通過梯度或者說法向量近似,這不是矛盾嗎?

不矛盾。一元函數可以通過切線來近似,這就是一元函數微分/導數的意義。二元函數的線性近似,如你所學,實際上比一元函數的條件複雜。二元函數的圖形一般是個曲面,在某點附近用該點的切平面近似。而你會發現,它在某處的梯度向量,實際上就是在該處切平面的法向量。


定義各路大佬都講得很好了,不再贅述。

我想談談它們之間的關係,權當拋磚引玉。

首先我們有一個標量場,即一個點(n元數對)到一個數的映射,並且保證它在定義域內具有連續的一階偏導數。

對於給定點來說,它(在給定方向上)的方嚮導數是一個數;它的梯度是一個(n維)向量。

它的方嚮導數就是梯度在該方向上的投影,(顯然當給定方向與梯度方向一致時方嚮導數最大);如果你取n個線性無關的方向求出方嚮導數,那麼你可以用這n個方嚮導數(帶方向)線性表示梯度向量。


可微函數在一點x0的梯度,

是函數限制在x0等值集,

以等值集為定義域,

上的切平面的,

一個不一定是單位長度的法向量


一元函數的導數:

如果存在一個數A,使得(對於固定的x)(f(x+Δx)-f(x)-AΔx)/Δx在Δx趨於0的時候趨於零,那麼稱A是函數f在x處的導數。

n維多元函數的導數:

如果存在一個從R^n到R的線性變換T,使得(對於固定的x在R^n里)(f(x+Δx)-f(x)-TΔx)/|Δx|在Δx趨於0的時候趨於零,那麼稱T是函數f在x處的導數。

(有限維空間上的向量的範數相互「等價」,選任何一個都會得到相同的定義)

在規定內積之後,對任意V到R的線性變換T,存在唯一的V中向量α,使得Tx=(x,α)。取R^n上標準內積,導數T對應的這個α就是梯度。

而方嚮導數無非是選好某方向的單位向量n求Tn而已。

(導數不存在而某些方嚮導數存在的函數存在,但是日常的函數其實都還是可導的比較多,前者只是特例)


方嚮導數:給一個方向,出一個實數(函數/標量場沿該方向的變化率)。

梯度:給一個函數/標量場,出一個矢量場(方向為每點方嚮導數值最大的方向,大小為其變化率的矢量組成的矢量場)。


看動畫吧, 打開看大圖. 觀察底部表示方嚮導數(藍色)梯度(黑色)的箭頭指向(兩者這裡只表示方向).


見網易公開課 《多變數微積分》


首先理解「梯度」和「方嚮導數」要先理解「導數」和「偏導數」。導數其實就是描述一個東西的變化率(變化程度快慢)。如同加速度就是描述速度變化快慢一樣。偏導數,就是某一個有多種影響因素的東西,某一個因素對它的影響。就像山一樣,延x,y,z方向上都有起伏(可能這樣描述並不恰當,但可以這樣理解)。

「梯度」,就是函數變化率最大的方向。以山為例,就是坡度最陡的方向,而梯度值就描述了這個坡到底有多陡。那麼如何求這個方向呢?於是我們就先求出每個方向上的坡度變化率(偏導數),每個方向上坡度變化率組成的向量自然就是變化率最大的方向,就是我們說的梯度。

「方嚮導數」,顧名思義就是函數在某一個方向上的導數。就是函數在某個方向的變化率。我們知道了梯度,再點乘某個方向的單位向量,自然就是這個方向上的變化率。


1.梯度。梯度就是在不同方向上的變化率。二維的情況只有x,y,只需要求y關於x的變化率,也叫做導數。但是在三維的情況下,t關於x,y變化,存在兩個方向的變化,用向量就能直觀表示出兩個方向上的變化了,如下圖。

2.方嚮導數。

用一個題目來理解一下。求一個函數,在一點處,沿著一個方向的方嚮導數。

求出方向l以後,實際上是將函數在x軸的變化率和y軸的變化率映射到方向l上。畫的圖比較粗糙,簡單理解一下,見諒。黃顏色筆圈住的就是偏導數映射在方向l上的長度,將兩個相加,就能獲得函數在方向l的變化程度。實際上啊,就是說x軸和y軸的對方向l的貢獻嘛~方嚮導數只是一種演算法,要是想乘起來什麼的也是可以的,這只是數學上的一種衡量方法。


非常感謝樓主的直觀的圖形表達,我現在也比之前懂了不少,談下我的總結:

方嚮導數,就是函數f(x,y)在點P0(X0,Y0)處沿方向L的變化率。L也可以是X軸或者Y軸,這樣就可以跟偏導數一樣了。

沿著不同的方向,函數的增長率或者變化率快慢不一樣,有的方向很慢,有的方向很快,有的方向不快不慢,梯度呢,是一個人為的定義的方向,不管是梯度也好,還是方向也好,都可以把它理解為一個向量(對於f(x,y)函數來說,就是個二維向量),根據梯度的定義和方嚮導數計算表達式,結合空間解析幾何的用坐標表示的兩個向量的數量積有關知識,可以證明:只要沿著這個特殊的方向——梯度,那麼函數的變化率是最快的,也就是說方嚮導數是最大的。此時的方嚮導數的值就是梯度的模。

對於我,最大的困惑就是方向這個理解(我起初總是把方向跟f(x,y)的值扯在一塊,把它想像成空間的一條直線)),看了樓主分析,才知道方向是x0y平面上的一個矢量,我們一般說的沿著X軸,沿著Y軸,其實也是個方向(暫且把它記為:Lx,Ly),對於2元函數而言,沿X軸,並不意味著Y軸沒有值,而是Y的值一直不變,也就是說這兩種方向都是針對一個變,一個恆定的,沿著這樣的方向,f(x,y)會連續取得一系列的值,其實從幾何上看是一條空間曲線。那麼更一般的情況,有時候我需要讓(x,y)沿著可能讓x,y的值都可能同步變化的方向Lxy,那麼根據一系列的點(x,y)照樣可以得出一系列連續的f(x,y),其實它也是一條空間曲線(從幾何上看),因為那個方向的(x,y)限制著它不可能沿著其他方向變化,當(x,y)沿著所有的方向變化的時候,就得到一個空間曲面f(x,y)了。

我的理解是:方向,是針對所有自變數(x,y)的值變化的一個控制的矢量,而因變數z或者f(x,y)的取值呢,受到這個基於這個方向的自變數的變化的影響而產生不一樣的變化過程,有些方嚮導致因變數f(x,y)變化特別快,有些導致它變化的很慢。

理解了方向和方嚮導數,我們說下梯度下降法當中的迭代過程,其中有下面的公式:

我們看下公式2,有沒有初學者跟我一樣,根本不知道它是怎麼來的不?

一開始很不明白上圖中的a(k+1)的表達式怎麼可以表示成這樣,其實這個問題非常簡單,繞了一大圈,之前老想從偏導數和極限以及方嚮導數與梯度的關係,想證明式子的左邊和右邊是近似相等或者絕對相等的,但是根本沒法推出來,你其實完全拋開上面的

中關於梯度的聯繫,你就把它當做一個向量(如果是2元導數的話),最最核心的是,我現在要讓ak沿著這個矢量走,得到a(k+1)那麼單純從空間解析幾何當做坐標的向量線性表示有個知識可以得出,它就是這樣的公式:

向量運算中,假設e為某個矢量L的單位向量。那麼知道了起始點(x0,y0)必然有得到L上的另外一點的坐標:(x1,y1)=s*e+(x0,y0),s為(x0,y0)到(x1,y1)的距離,那麼回到剛才的問題:

可以把這個矢量e看做梯度,因為梯度也是矢量,根據沿著梯度方向,函數變化率最快的原理,我就是要沿著這個方向,不斷逼近極值點,如何才能算是逼近呢,這個就要在迭代過程當中尋找偏差。記住:某一點的方嚮導數有很多個,但是梯度,只有一個。它是使得方嚮導數達到最大值的唯一的一個方向,沒有其二。


在三維空間中考慮一個曲面,其表達式可以用顯函數表示為z = f(x,y),那麼它在A(a,b)處的梯度gradA(a,b),是一個向量,這個向量的幾何意義是:

1.就方向而言,此向量所朝向的是使得f(x,y)在A(a,b)這個點有最大的方嚮導數的方向

2.就大小而言,是長度為最大方嚮導數的那個值

如果用隱函數g(x,y,z) = 0表示,那麼其在A(a,b,c)的梯度gradA(a,b,c),是曲面在A處的法向量。


談論方嚮導數或是梯度時都是在自變數構成空間里討論的,此時體現不出因變數的值。

(對於三維空間)當方向與z軸垂直時,(此時只有x,y參與,方嚮導數的維度可以類似看作2),可以表示x,y延該方向z的變化速率。(偏導數是一種情況)(雖然都是方嚮導數,但一般情況必須把曲面看成更高維度的等值面...除非將坐標軸旋轉把該方向變成坐標軸方向,但因變數也隨之改變)

梯度就是在這個自變數空間里,遠離其等值面最快的方向。變化的速率是沿這個方向的方嚮導數。

所以我們能看到求曲線切平面的法向量的公式與求梯度的公式相同。(但它們的實際意義所在的維度不同...)

(大一學生自己的理解...說的比較亂,如有錯誤請指出)


  • 其實可以最簡單的方式說一個標量,比如前面幾位提到山高,或者溫度,都可以做幾個變數的全微分,比如這樣 ΔT=?T/?x +?T/?y+?T/?z=(?T)*(Δx,Δy,Δz)=|?T|*|ΔR|*cosθ
  • 方嚮導數就是T的梯度投影在你自己定的方向上;從而也說明了標量的梯度是方嚮導數最大值;即變化率最大的時候


梯度和偏導數都是特殊的方嚮導數,如果函數可微,那麼函數在這一點的任何方嚮導數都存在且都在一個平面上(這個平面的一組基是各個偏導數方向的向量,該平面稱為切平面)。所以說,當你把方向選擇為平行於坐標軸時,方嚮導數就是偏導數。如果所有的方嚮導數都可以寫成偏導數的線性組合,那麼說明該函數可微,而且該點微分可以寫成梯度和方向向量的內積(因為可微,全導數等於該方向的方嚮導數等於偏導數的某個線性組合,而梯度各個分量就是偏導數,所以可以寫成方向向量和梯度的內積),由此可以進一步得出,當梯度和方向向量方向相同時,微分取得最大值(這就是說梯度是函數值變化最大的方向);垂直時,函數值不變(這就是無差異曲線或者說level set);相反時,函數值衰減最快。

總結,函數可微時,方嚮導數都存在且都可以表達成偏導數的線性組合,係數是對應方向的分量,所以也可以寫成梯度向量和該方向的內積。


第七節 方嚮導數與梯度

這篇文章不錯。

梯度的模為方嚮導數的最大值。


作為一個考研生,我來說下研究的結果,這樣應該比較好理解。。。

1、如果是研究二元函數z=(x,y)圖像在被平面x=c,或者y=c截得的曲線的變化率,用偏導數就可以(偏導數其實還是二維的概念,實質是反映被截得的平面上的一條曲線。所以,某在點偏導數存在你根本不知道這個點函數是不是連續,是不是可微,因為你只知道最多兩個平面內的情況。)

2、一次函數不同(每個點只有一個倒數),二次函數其他亂七八糟的方向的斜率我們怎麼研究?

於是,我們定義某個方向(用向量表示)上的方嚮導數。(你只需要知道,就像一元函數導數一樣,他能反映某方向的變化率)。

3、我們由可微,根據定義計算方嚮導數,發現方嚮導數=這點偏微分組成的向量F點乘這個方向的單位向量E,由方嚮導數=|F|*|E|*cosα進一步發現,方嚮導數存在最大值,值為|F|,當且僅當方嚮導數方向和F相同,而且,這個方向由於是2個分量表示的,想取最大,肯定這個方向向量要平行於xoy面嘍(至於這個方向具體如何我們現在不知道)

4、這個向量F好像有點特殊啊,既然能表示最大的方嚮導數大小和那個方向,我們就重視下,單獨定義它吧,就叫梯度,變化最快嘛。

5、二元函數z=(x,y)為例,通過等值線概念,我們在到xoy平面來研究他的等值線(一元函數圖形y(x)),發現等值線某點法向量正好是F,那就說明F方向就是垂直於等值線了(對於二元函數圖形,梯度方向是垂直於等值線平行於xoy面的,對於三元函數,我們做不出他的圖形,但是同理可以知道他的梯度方向是垂直於等值面的)

6、至於其他方向的方嚮導數,相當於做了無用功,以二次曲面z=(x,y)為例,可以想像一下,一個山的表面一樣的圖形,你面對山水平向前走進山裡x米,或者其他方向走爬x米,停下後,哪個使你頭上的山的z更大,其實就是直角邊斜邊的關係,所以這個方向變化最快,方嚮導數最大,你走其他方向始終浪費了一定比例的體力,也就是其他方嚮導數只能是梯度在那個方向的投影的來源。


樓上答案都沒錯誤,但是,直觀形象理解這兩個概念的關鍵是熟練掌握高代里線性映射、矩陣那一套語言。在此前提下,牢記「微分是映射的局部線性近似」這一點,其他一切都可以自然地推出來。這裡「其他一切」包括從基本的偏導概念到隱函數定理。

順便問一句,有什麼好辦法能「直觀形象」理解最一般的隱函數定理?


兩個偏導數的幾何意義解釋的非常好,方嚮導數的幾何意義呢?是哪條切線的斜率?切線是怎麼形成的?當所有切線能夠形成一個平面的時候,這個平面就是切平面。


梯度是定義域為Rn上函數在n個分量上的偏導數組成的向量,函數可微的情況下,梯度向量組成了這點的切平面。方嚮導數是單位向量與梯度的內積,內積是投影再乘以長度,這樣看內積最大就是平行了。


常見的偏導數是沿x,y方向的方嚮導數,是方嚮導數中的特例。梯度是個向量,有自己的方向和大小。導數是一種函數關係。這兩者本質不同。


推薦閱讀:

為什麼我的同學們可以知道這麼多數學公式?
怎樣看待有人說他用初等數學方法證明了費馬大定理?
當我們說「正則」的時候,到底想說個什麼意思?
如何看待美國學者稱,「(可以)用簡易方法證明費馬大定理」?
你曾經因為做不出數學題哭泣過嗎?

TAG:數學 | 微積分 | 高等數學 | 高等數學大學課程 |