秩和檢驗的作用和原理是什麼?
剛入門學習統計知識,對秩和檢驗的作用不是很了解,希望被告知!
秩和檢驗方法最早是由維爾克松(Wilcoxon)提出,叫維爾克松兩樣本檢驗法。後來曼—惠特尼將其應用到兩樣本容量不等(n1不等於n2)的情況,因而又稱為曼—惠特尼U檢驗。這種方法主要用於比較兩個獨立樣本的差異。
1、假設中的等價問題
設有兩個連續型總體, 它們的概率密度函數分別為:
f1(x),f2(x)(均為未知)
已知f1(x) = f2(x ? a),a為末知常數,要檢驗的各假設為:
H0:a = 0,H1:a &< 0.H0:a = 0,H1:a &> 0.H0:a=0,H1, a&<&>0.
設兩個總體的均值存在,分別記為μ1,μ2,由於f1,f2最多只差一平移,則有μ2 = μ1 ? a。此時, 上述各假設分別等價於:
H0:μ1 = μ2,H1:μ1 &< μ2H0:μ1 = μ2,H1:μ1 &> μ2H0:μ1 = μ2,H1:μ1&<&>μ2
2、秩的定義
設X為一總體,將容量為n的樣本觀察值按自小到大的次序編號排列成x(1) &< x(2) &< Λ &< x(n),稱x(i)的足標i為x(i)的秩,i = 1,2,Λ,n。
例如:某施行團人員的行李重量數據如表:
重量(kg)
34 39 41 28 33
寫出重量33的秩。
因為28&<33&<34&<39&<41,故33的秩為2。
特殊情況:
如果在排列大小時出現了相同大小的觀察值, 則其秩的定義為足標的平均值。
例如: 抽得的樣本觀察值按次序排成0,1,1,1,2,3,3,
則3個1的秩均為(2+3+4)/3=3.兩個3的秩均為(6+7)/2=6.5.
3、秩和的定義
現設1,2兩總體分別抽取容量為n1,n2的樣本,且設兩樣本獨立。這裡總假定 n1&<&>n2。
我們將這n1 + n2個觀察值放在一起,按自小到大的次序排列,求出每個觀察值的秩,然後將屬於第1個總體的樣本觀察值的秩相加,其和記為R1,稱為第1樣本的秩和,其餘觀察值的秩的總和記作R2,稱為第2樣本的秩和。
顯然,R1和R2是離散型隨機變數,且有R1+R2=( (n1+n2)(n1+n2+1) )/2.
4、秩和檢驗法的定義
秩和檢驗是一種非參數檢驗法, 它是一種用樣本秩來代替樣本值的檢驗法。
用秩和檢驗可以檢驗兩個總體的分布函數是否相等的問題
秩和檢驗的適用範圍
如果兩個樣本來自兩個獨立的但非正態獲形態不清的兩總體,要檢驗兩樣本之間的差異是否顯著,不應運用參數檢驗中的T檢驗,而需採用秩和檢驗。
秩和檢驗的方法
1、兩個樣本的容量均小於10的檢驗方法
檢驗的具體步驟:
第一步:將兩個樣本數據混合併由小到大進行等級排列(最小的數據秩次編為1,最大的數據秩次編為n1 + n2)。
第二步:把容量較小的樣本中各數據的等級相加,即秩和,用T表示。
第三步:把T值與秩和檢驗表中某α顯著性水平下的臨界值相比較,如果T1 &< T &< T2,則兩樣本差異不顯著;如果T&<&>T1或T&>=T2, 則表明兩樣本差異顯著。
例:某年級隨機抽取6名男生和8名女生的英語考試成績如表1所示。問該年級男女生的英語成績是否存在顯著差異?
男、女生英語考試成績表
http://images.cnblogs.com/cnblogs_com/emanlee/201112/201112171326205276.jpg
解:檢驗步驟:
(1)建立假設:
H0:男女生的英語成績不存在顯著差異H1:男女生的英語成績存在顯著差異
(2)編排秩次,求秩和:
T= 13 + 7 + 14 + 12 + 5.5 + 11= 62.5
(3)統計推斷:根據n1 = 6,n2 = 8,α = 0.05, 查秩和檢驗表,T的上、下限分別為T1 = 29,T2 = 61,有T &> T2,結論是:男女生的英語成績存在顯著差異。
3、兩個樣本的容量均大於10的檢驗方法
當兩個樣本容量都大於10時,秩和T的分布接近於正態分布,因此可以用Z檢驗,其基本公式為:
http://images.cnblogs.com/cnblogs_com/emanlee/201112/201112171326234112.png
式中:T為較小的樣本的秩和。
例:某校演講比賽後隨即抽出兩組學生的比賽成績如表2,問兩組成績是否有顯著差異?
http://images.cnblogs.com/cnblogs_com/emanlee/201112/201112171326232782.jpg
解:檢驗步驟:
(1)建立假設:
H0:兩組成績不存在顯著差異H1:兩組成績存在顯著差異
(2)編排秩次,求秩和:
n1 = 12,n2 = 14,T = 144.5,代入公式,有:
http://images.cnblogs.com/cnblogs_com/emanlee/201112/201112171326246752.png
(3)統計推斷:因為|Z|&<1.96,則應保留虛無假設,拒絕備擇假設。結論是:兩組的演講比賽成績不存在顯著差異。
http://wiki.mbalib.com/wiki/%E7%A7%A9%E5%92%8C%E6%A3%80%E9%AA%8C
http://www.mipang.com/blog/381684.94d.htm
http://baike.baidu.com/view/1889901.htm
它是非參數檢驗的一種,它的假設檢驗是推斷總體分布是否相同,而不是推斷總體參數是否相等,這也是它與參數檢驗的區別。它的作用通俗來說是通過推斷總體的分布相同與否來判斷樣本是否存在差異。
推薦閱讀:
※阿西莫夫的心理史學有可能實現么?
※數據什麼時候需要做中心化和標準化處理?
※hypothesis testing幾個不同的test類型到底有什麼具體區別?
TAG:統計 |