R語言——回歸分析
一:回歸的類型
簡單線性:用一個量化的解釋變數預測一個量化的相應變數
多項式:用一個來量化的解釋變數預測一個量化的相應變數,模型的關係是n階多項式
多層:用擁有等級結構的數據預測一個響應變數(例如學校中教室里的學生)。也被稱為分層模型,嵌套模型或混合模型
多元線性:用兩個或多個量化的解釋變數預測一個量化的 響應變數
多變數:用一個或多個解釋變數預測多個相應變數
Logistic:用一個或多個解釋變數預測一個類別型響應變數
泊松:用一個或多個解釋變數預測一個代表頻率的響應變數
Cox比例風險:用一個或多個解釋變數預測一個時間發生的時間
時間序列:對誤差項相關的時間序列數據建模
非線性:用一個或多個解釋變數預測一個類別型響應變數,不過模型是非線性的
非參數:用一個或多個解釋變數預測一個類別型響應變數,模型的形式源數據形式,不事先設定
穩健:用一個或多個解釋變數預測一個類別型響應變數,能抵禦強影響點的干擾
l二:OLS回歸
OLS回歸是通過預測變數的加權和來預測量化的因變數,其中權重是通過數據估計而得以的參數。使殘差平方和最小
為能夠恰當地解釋OLS模型的係數,數據必須滿足以下統計假設:
(1)正態性對於固定的自變數,因變數值成正態分布
(2)獨立性 Yi值之間相互獨立
(3)線性
因變數與自變數之間為線性相關(4)同方差性因變數的方差不隨自變數的水平不同而變化,即不變方差或同方差性
三: 用lm()擬合回歸模型
擬合線性模型最基本的函數就是lm(),格式為:
myfit<-lm(formula,data)
formula指要擬合的模型形式,data是一個數據框,包含了用於擬合模型的數據
formula形式如下:Y~X1+X2+……+Xk (~左邊為響應變數,右邊為各個預測變數,預測變數之間用+符號分隔)
以上為r語言回歸的基本理論,下篇文章,為大家提供實戰的「簡單新型回歸」「多項式回歸」有疑問歡迎留言~~
推薦閱讀: