Logistic回歸的檢驗方法有哪些?R中有比較完備的處理logit回歸的包嗎?
小白初入統計大門,問題有點多,求大神指教~---------------------
Logistic回歸除了檢驗各係數的顯著性(p 值),似然比檢驗外,還有哪些檢驗模型擬合優度的方法? 如果使用logit建立評級體系(分類)除了ROC曲線及c統計量(AUC)外,還有哪些指標和方法評價模型的質量? 最後R中是否有完備的包處理Logit回歸呢?
我上一組圖吧,我做的,發在我的微信公眾號「醫學統計分析精粹」上的。
當然,這組幻燈不是專門用來回答題主的問題的。但其中大多數包都可以用來實現logit回歸,並且附帶各種評價指標,大多都還是比較完備的。
用ROC來評價logit,這個不是很靠譜,ROC的用處不是這個。AUC倒是可以,但其核心是一致性。http://weixin.qq.com/r/I3UBGaXE7-iQreF69yAx (二維碼自動識別)
首先僅僅是logistic的話,glm就夠了,而且這個包裡面支持了inference,diagnostic等。考慮overdisperation用vgam考慮模型選擇可以glmnet至於有的答主說的optim什麼的,重申一遍,glm對指數分布族不是無腦的牛頓法,初值什麼的也不是那麼簡單。
在 SAS Base 中,PROC LOGISTIC, GENMOD, PROBIT,CATMOD 都可以 estimate a binary logit model,PROC LOGISTIC 是首選。
在新的 SAS High Performance Computing 框架中,可以使用 PROC HPLOGISTIC,這個過程步支持大規模並行計算,並行讀寫數據。(測試中,基於10億條數據的建模可以在5分鐘內完成)
LOGISTIC provides two techniques for obtaining maximum likelhood estimates:
Fisher Scoring (the default value for LOGISTIC)
Newton-Raphson
HPLOGISTIC provides additional optimization techniques:
Conjugate-gradient
Double-dogleg
Newton-Raphson with line search
Nelder-Mead simplex
None
Newton Raphson with ridging (the default value for HPLOGISTIC
(TECHNIQUE=NRRIDG))
Dual quasi-Newton
Trust-region
SAS University Edition 可以免費下載 Free Statistical Software, SAS University Edition
R里的話glm足夠了吧。。
推薦閱讀:
※關於GBDT的幾個不理解的地方?
※GBDT預測時每一棵樹是否能並行?
※如何評價中山大學鄭子彬教授?
※如何求出libsvm中每個樣本點到超平面的歐式距離?
※一張圖片上有上百種顏色,如何在一張圖上篩選出小於五種的基本色,或者在一張圖上進行顏色劃分歸類?
TAG:統計學 | 數據分析 | 機器學習 | R編程語言 | Logistic回歸 |