最小二乘法和相關係數公式怎麼記憶?

快要吐血了真的不理解記不住


題主你好,記憶的前提還是在於理解。
先說相關係數,假設你對期望和方差是深刻理解的,接下來的關鍵是理解協方差,協方差描述的是兩個隨機變數變化趨勢是否一致:

如果兩個變數的變化趨勢一致,也就是說如果其中一個大於自身的期望值,另外一個也大於自身的期望值,那麼兩個變數之間的協方差就是正值。 如果兩個變數的變化趨勢相反,即其中一個大於自身的期望值,另外一個卻小於自身的期望值,那麼兩個變數之間的協方差就是負值。

再說最小二乘法,首先是名字的由來,二乘表示平方,最小二乘表示誤差平方和最小的意思。誤差平方和是一個關於權重係數W的函數,可用求一階偏導的方式對其關於W的最優化。
我相信題主你,包括大部分都能記住最小二乘的解題過程及解題條件。但是,是不是覺得每次都推導一次結果很煩?難道最小二乘解的公式只能靠死記硬背?
其實並不是,要我說,其實最小二乘解的結構是一個非常「自然」的表示。假設待預測的樣本個體為x",W * x"為該個體的預測結果,X為訓練樣本,你的第一直覺中x"的預測值應該是什麼呢?對了,在訓練樣本X中,哪一些個體與x"越相似,那麼x"的預測值就應當與其越相似,而最小二乘解的意義就是這麼地直白!假設X為方陣時,利用最小二乘解對個體x"進行預測的過程為:

首先用X的逆矩陣與x"相乘,得到X中每個個體與x"的「相似度」,然後用「相似度」乘以其對應的預測結果進行綜合成為x"的預測結果。
那麼,問題來了,為什麼X的逆矩陣與x"相乘,能表示「相似度」?
請參考:矩陣求逆的幾何意義是什麼? - 城東的回答
當X不為方陣時,最小二乘解的權重係數為:

在我的博文的第3小節中,對X不為方陣情況進行了說明。
請參考:關於線性模型你可能還不知道的二三事(二、也談民主)


LXY / LXX

上面和下面的形式是一樣的, 上面是 連加(x*y) - n*連加(x)*連加(y)
下面是 連加(x*x) - n*連加(x)*連加(x)

如果想更簡記得話,你可以想像成,上面的x和下面的x約分,最後只剩下Y/X


用英語比較順口x prime x inverse x prime y相關係數是協方差除標準差乘積


推薦閱讀:

如何提高記憶力?提高學習效率?
電影《墊底辣妹》中有哪些小細節值得讓我們學習?
有哪些APP適合每天花費少量時間使用並能從中受益匪淺?
學得東西太多,都記不住了怎麼辦?提高記憶力的方法是什麼?

TAG:數學 | 大學 | 統計學 | 高效學習 | 記憶方法 |