學生化殘差中的學生化是什麼意思?

最近在學回歸分析,學到學生化殘差的時候,對這個名詞的命名不是很懂是什麼意思。查了一下英語翻譯是studentized,不知道應該怎麼理解?


業餘統計學研究者 W. Gosset 以筆名 Student 發表關於 T 分布的統計學史地標性文獻。在回歸模型中,要圖示正態分布的殘差是否偏大,分母的尺度基準是抽樣誤差總體標準差sigma乘比例常數,實際應用中sigma總是未知,分母用的是它的點估計s。此時得到的不再是標準正態分布,而是T分布。這種標準化 / Standardized 不再是標準正態化。稱之為 Studentized,可能因為 T-ized 英文會顯得很古怪。中文如果翻譯為「T化殘差」,其實比「學生化殘差」更自然。

如果是統計課講師王小波來翻譯,Student 肯定得譯為「晚生」。他的專欄就叫《晚生閑談》 ——

王小波給《三聯生活周刊》寫雜文的時候,「三聯」還是雙月刊。1996年,「三聯」成為雙周刊後,王小波應約寫專欄《晚生閑談》。在一年多的時間裡,最後一頁的《晚生閑談》成為「三聯」形象的不可缺少的一部分。「沒有王小波文章的《三聯生活周刊》總是有一兩分不像」(林白語)。朱偉(《三聯生活周刊》主編)認為王小波的文字是真正的專欄文章,不做簡單的評判,總有很好的角度。「三聯」最初找過余華、蘇童作文討論生活,總覺得口味不大合適。王小波之後,再找專欄作家仍然覺得很困難。

南方周末——[文學]作為專欄作家的王小波


殘差(residual)=觀察值 - 預期值

一個好的線性回歸殘差應該是符合正態分布的,因此可以通過變換使得殘差符合自由度為N-K-2的t分布。

t分布因為叫做student『s t distribution, 所以這個變換後的殘差值就是studentized residual。

通過檢查這個值可以知道觀察值的分布情況,可以用來尋找outlier及確定其p value。

因為最近學R才開始回顧線性回歸,回答得晚了&>&<


t分布的推導由英國人威廉·戈塞特(Willam S. Gosset)於1908年首先發表,當時他還在愛爾蘭都柏林的吉尼斯(Guinness)啤酒釀酒廠工作。酒廠雖然禁止員工發表一切與釀酒研究有關的成果,但允許他在不提到釀酒的前提下,以筆名發表t分佈的發現,所以論文使用了「學生」(Student)這一筆名。之後t檢定以及相關理論經由羅納德·費雪(Sir Ronald Aylmer Fisher)的發揚光大,為了感謝戈塞特的功勞,費雪將此分布命名為學生t分布(Student"s t)。

This is an important technique in the detection of outliers. It is among several named in honor of William Sealey Gosset, who wrote under the pseudonym Student, and dividing by an estimate of scale is called studentizing, in analogy with standardizing and normalizing


對於統計學的指標名稱已經無力吐槽!單是一個協方差就好幾種名稱!我繼續吐槽!


國內對這些名詞的翻譯也是無力吐槽了。


學生化,哈哈。student是一個人,他發明了t分布,studentized就是把其他分布轉換成t分布


法語裡面是Loi de Student,一開始很長時間都在懵圈中,效率比本國人慢,比人家學的累,太陽曬到哈士奇的屁屁了


推薦閱讀:

非線性回歸的驗證?
線性回歸中,殘差的和為什麼等於0?這個假設的依據是什麼?
線性回歸的相關指數R平方的表達式(見圖)是怎麼來的?
如何簡明地解釋「線性回歸」「貝葉斯定理」「假設檢驗」這些術語?
線性回歸中的 ANOVA 的作用是什麼?

TAG:統計學 | 回歸分析 | 線性回歸 | 最小二乘法 |