線性回歸中,殘差的和為什麼等於0?這個假設的依據是什麼?
01-14
殘差和為0不是一個假設,而是OLS定義下的一階條件(first order condition)。當然還有一個條件是自變數中含有截距項!
證明如下:
OLS的目標函數為最小化殘差平方和(SSR,sum of squared residuals),即
為此,我們對該式分別關於、、....求導,並逐個使導數為0。當然要得到題主想要的結論,我們對beta1到betak都不關心,只考慮對beta0求導的結果。
為了方便,我們令
則根據鏈式法則,我們有
(式子1)
又有
,
則式子(1)可以改寫,並使之等於0,
則,我們得到
即OLS線性回歸中,通過定義,必然滿足殘差和為0的條件,而並不是通過什麼「假設」得來的。
因為一般線性模型用ols估計,要求殘差和為0,不然殘差和會併入截距項。
推薦閱讀:
※非線性回歸的驗證?
※線性回歸的相關指數R平方的表達式(見圖)是怎麼來的?
※如何簡明地解釋「線性回歸」「貝葉斯定理」「假設檢驗」這些術語?
※線性回歸中的 ANOVA 的作用是什麼?
※通過邏輯回歸的sigmoid函數把線性回歸轉化到[0,1]之間,這個值為什麼可以代表概率?