矩陣求導能否使用鏈式法則?維基百科上這句是啥意思

主要是維基百科Matrix calculus
這裡說如果涉及矩陣的函數是不能用鏈式法則的,但是確實很多深度學習講義上還是用了,所以到底能不能用?


你需要的是 https://pan.baidu.com/s/1pKY9qht (如果連接失效,請到 機器學習中的矩陣/向量求導 一文中找最新鏈接。本文長期保持更新)。

如果沒有耐性看完,可以只看第四頁下半部分的注。


egin{align} m{h}(m{t})=m{f}ig(m{x}(m{t})ig)	o mathrm{D}m{h}=mathrm{D}m{f}cdotmathrm{D}m{x}\h(m{t})=fig(m{x}(m{t})ig)	o mathrm{D}h= mathrm{D}m{x}^	ext{T}cdotmathrm{D}f end{align}

具體參考 Vector_Calculus Susan Jane Colley Oberlin College 其實就是線性變換。變換來變換去。當然需要滿足一定條件,不過很多情況下滿足。


參考北大伍勝健《數學分析》第三冊


推薦閱讀:

一個數介於2和3之間,那麼它為無理數和有理數的概率分別為多少?
中值定理的條件中,為什麼同時要「開區間內可導」和「閉區間上連續」兩個條件?
為什麼曲面積分裡面的ds=(1+zx2+zy2)?dxdy呢?
大學數學系4年要學哪些東西?
數學中的充分條件、必要條件如何理解?

TAG:數學 | 矩陣運算 | 高等數學 | 矩陣 |