R語言——回歸分析

一:回歸的類型

簡單線性:用一個量化的解釋變數預測一個量化的相應變數

多項式:用一個來量化的解釋變數預測一個量化的相應變數,模型的關係是n階多項式

多層:用擁有等級結構的數據預測一個響應變數(例如學校中教室里的學生)。也被稱為分層模型,嵌套模型或混合模型

多元線性:用兩個或多個量化的解釋變數預測一個量化的 響應變數

多變數:用一個或多個解釋變數預測多個相應變數

Logistic:用一個或多個解釋變數預測一個類別型響應變數

泊松:用一個或多個解釋變數預測一個代表頻率的響應變數

Cox比例風險:用一個或多個解釋變數預測一個時間發生的時間

時間序列:對誤差項相關的時間序列數據建模

非線性:用一個或多個解釋變數預測一個類別型響應變數,不過模型是非線性的

非參數:用一個或多個解釋變數預測一個類別型響應變數,模型的形式源數據形式,不事先設定

穩健:用一個或多個解釋變數預測一個類別型響應變數,能抵禦強影響點的干擾

l二:OLS回歸

OLS回歸是通過預測變數的加權和來預測量化的因變數,其中權重是通過數據估計而得以的參數。使殘差平方和最小

為能夠恰當地解釋OLS模型的係數,數據必須滿足以下統計假設:

(1)正態性對於固定的自變數,因變數值成正態分布

(2)獨立性 Yi值之間相互獨立

(3)線性

因變數與自變數之間為線性相關

(4)同方差性因變數的方差不隨自變數的水平不同而變化,即不變方差或同方差性

三: 用lm()擬合回歸模型

擬合線性模型最基本的函數就是lm(),格式為:

myfit<-lm(formula,data)

formula指要擬合的模型形式,data是一個數據框,包含了用於擬合模型的數據

formula形式如下:Y~X1+X2+……+Xk (~左邊為響應變數,右邊為各個預測變數,預測變數之間用+符號分隔)

以上為r語言回歸的基本理論,下篇文章,為大家提供實戰的「簡單新型回歸」「多項式回歸」有疑問歡迎留言~~


推薦閱讀:

TAG:R編程語言 | 數據分析 | 數據處理 |