為什麼叫Student t檢驗?

微信公眾號:折耳根說

人民衛生出版社《衛生統計學》第6版第六章第二節 t分布中寫道:

英國統計學家W. S. Gosset於1908年以筆名「Student」發表論文,證明t分布服從自由度v=n-1t分布,即

t分布,又稱Student t分布(Student『s t distribution),記作t ~ t(v)。t分布十分有用,它是總體均數的區間估計和假設檢驗的理論基礎。

為什麼t檢驗稱為Student~t檢驗,t分布稱為Student~t分布?而不像其它的統計方法以科學家名字命名,如Fisher精確檢驗、Pearson相關等?

William Sealy Gosset(1876.6.13-1937.10.16)

後被稱為英國統計學家

1912年的Karl Pearson

Gosset先在牛津大學學習化學和數學

1899年畢業後

在愛爾蘭都柏林Arthur Guinness 啤酒廠

任釀酒化學技師

從事試驗和數據分析工作

在已知總體均值和標準差時

樣本均值的分布將隨著樣本容量n增大

越來越接近正態分布

但是

Gosset試驗中的樣本量都不大

一般只有5個

Gosset對每個樣本分別計算X,S,t,即

獲得大量t觀察值

發現

t在(-1,1),(-2,2),(-3,3)內的頻率

0.626,0.884,0.960

與N(0,1)在相應區間上的概率

0.683,0.995,0.997

相差較大

於是

他懷疑

是否還存在一個不屬於正態分布族的其它分布呢?

為了研究這個問題

Gosset在1906-1907年去倫敦大學學習統計

與著名統計學家Karl Pearson(1857-1936,老Pearson)

1912年的Karl Pearson

1912年的Karl Pearson

和他的兒子Egon Sharpe Pearson(1895-1980,小Pearson)

共同討論

Egon Sharpe Pearson

終於得到新的密度函數曲線

Gosset於1908年(32歲)以「Student」筆名發表此研究結果

在當時正態分布作為「萬能分布」的時代里

代表統計學最高的水平的K. Pearson

只研究大樣本問題

他認為

小樣本是與統計精神相違背的

是危險傾向

在這種情況下

t分布並沒有被外界理解和接收

只在Gosset工作的釀酒公司使用

直到1923年

Gosset以筆名「Student」發表t分布15年後

另一位著名統計學家Fisher(1890-1962)

Ronald Aylmer Fisher

在農業實驗中

也遇到小樣本問題

發現t分布的實用價值

並給出嚴格但簡單的推導

1925年

Fisher又編製了t分布表

現在廣泛應用的t分布表

至此

Gosset的小樣本方法才被學術界承認

並迅速傳播、發展和應用

Gosset~t分布打開了人們新思路

開創了小樣本研究方法

在歷史上具有劃時代意義

但由於Gosset當時以Student發表

所以人們習慣稱為Student~t分布

而非Gosset~t分布

1935年

Gosset59歲

離開了都柏林

到倫敦皇家公園旁的一家Guinness啤酒廠

擔任總監

負責啤酒產量的科學研究

然而僅僅兩年後

年僅61歲的Gosset

因心臟病英年早逝

Guinness公司為Gosset製作的紀念章

由於當時理論不被接受及公司的各種限制,Gosset只能以筆名「Student」(學生)發表這一歷史性的成就。直至15年後,Fisher的驗證,t分布才被學術界承認並廣泛應用。後來的配對t檢驗、兩兩比較t檢驗等都是在Gosset~t檢驗的基礎上發展而來。然而Gosset並沒有因此成為同時代著名的統計學家,教科書也是一筆帶過。直至今天,大家熟知的仍是Student~t檢驗,奠定t分布基礎的Gosset知名度遠不如Pearson、Fisher。在歷史長河中,Gosset仍閃閃發光。謹以此文

撥開歷史的塵埃,

紀念做出巨大貢獻的Goseet!

參考資料

1.方積乾,孫振球. 衛生統計學(第6版). 人民衛生出版社,89.

2.nature.com/articles/140

3.en.wikipedia.org/wiki/W

4.茆詩松,王靜龍 ,濮曉龍.高等數理統計(第二版).高等教育出版社.

5.陳希孺.概率論與數理統計.中國科學技術大學出版社.


推薦閱讀:

TAG:衛生統計學 | T檢驗 | 正態分布 |