Logistic回歸的檢驗方法有哪些?R中有比較完備的處理logit回歸的包嗎?

小白初入統計大門,問題有點多,求大神指教~---------------------

Logistic回歸除了檢驗各係數的顯著性(p 值),似然比檢驗外,還有哪些檢驗模型擬合優度的方法?

如果使用logit建立評級體系(分類)除了ROC曲線及c統計量(AUC)外,還有哪些指標和方法評價模型的質量?

最後R中是否有完備的包處理Logit回歸呢?


我上一組圖吧,我做的,發在我的微信公眾號「醫學統計分析精粹」上的。

當然,這組幻燈不是專門用來回答題主的問題的。但其中大多數包都可以用來實現logit回歸,並且附帶各種評價指標,大多都還是比較完備的。

用ROC來評價logit,這個不是很靠譜,ROC的用處不是這個。AUC倒是可以,但其核心是一致性。

http://weixin.qq.com/r/I3UBGaXE7-iQreF69yAx (二維碼自動識別)


首先僅僅是logistic的話,glm就夠了,而且這個包裡面支持了inference,diagnostic等。

考慮overdisperation用vgam

考慮模型選擇可以glmnet

至於有的答主說的optim什麼的,重申一遍,glm對指數分布族不是無腦的牛頓法,初值什麼的也不是那麼簡單。


在 SAS Base 中,PROC LOGISTIC, GENMOD, PROBIT,CATMOD 都可以 estimate a binary logit model,PROC LOGISTIC 是首選。

在新的 SAS High Performance Computing 框架中,可以使用 PROC HPLOGISTIC,這個過程步支持大規模並行計算,並行讀寫數據。(測試中,基於10億條數據的建模可以在5分鐘內完成)

LOGISTIC provides two techniques for obtaining maximum likelhood estimates:

Fisher Scoring (the default value for LOGISTIC)

Newton-Raphson

HPLOGISTIC provides additional optimization techniques:

Conjugate-gradient

Double-dogleg

Newton-Raphson with line search

Nelder-Mead simplex

None

Newton Raphson with ridging (the default value for HPLOGISTIC
(TECHNIQUE=NRRIDG))

Dual quasi-Newton

Trust-region

SAS University Edition 可以免費下載 Free Statistical Software, SAS University Edition


R里的話glm足夠了吧。。


推薦閱讀:

關於GBDT的幾個不理解的地方?
GBDT預測時每一棵樹是否能並行?
如何評價中山大學鄭子彬教授?
如何求出libsvm中每個樣本點到超平面的歐式距離?
一張圖片上有上百種顏色,如何在一張圖上篩選出小於五種的基本色,或者在一張圖上進行顏色劃分歸類?

TAG:統計學 | 數據分析 | 機器學習 | R編程語言 | Logistic回歸 |