列聯表篇之四:單向有序列聯表的秩和檢驗
單向有序表分兩種,一種是分組或因子是有序的,結果是無序的。這種有序可以是連續變數取不同的水平,比如壓力、速度、年齡等等,雖然是連續數據,但我們將其分成幾段或取幾個水平,熟悉方差分析和DOE的人對此比較容易理解。當然在這裡結果變數是計數的,如不同壓力水平下PV管爆裂的數量。
nn還有的分組是順序數據,如技工級別、服務員星級等,這種順序有不少是基於主觀評價。
這種單向有序表的分析仍採用卡方檢驗,如比較各組的比率或構成。
第二種單項有序表是結果是有序的,分組是無序的。結果的順序一般基於主觀或客觀的評價,如醫學上通常將療效主觀分為無效、好轉、有效、顯效、治癒等級別,員工考核分為A、B、C、D四級,產品分為優質品、一等品、二等品等,電影評價1星到5星。如下表
對於這種表,卡方檢驗通常不太適用,大多會選擇秩和檢驗、Ridit檢驗或Logistic回歸。本文著重介紹秩和檢驗,下一篇介紹Ridit檢驗,Logistic檢驗比較複雜,在處理高維列聯表時比較常用,在回歸分析單元再考慮。
n秩和檢驗根據組數不同可分為2樣本Wilcoxon檢驗和多樣本(>2組)Kruskal-Wallis檢驗。
2樣本Wilcoxon秩和檢驗(Mann-Whitney U檢驗)
熟悉連續數據非參數檢驗的同志們應該對這個名詞很熟悉,當兩個樣本數據不滿足且無法變換成正態分布時,Wilcoxon檢驗通常是首選。
nWilcoxon檢驗是由化學家和統計學家FranknWilcoxon(1892.9.2—1965.11.18)於1945年提出。分為兩種,一種是針對兩組獨立樣本Wilcoxon秩和檢驗(Mann-Whitney檢驗),一種是針對配對樣本的Wilcoxon符號秩檢驗。
n其原理就是不管樣本中的數據到底是多少,將兩樣本從小到大排序,然後按順序賦秩,最小的賦為1,最大的賦為n1+n2,如果兩個樣本的秩相差不大,則說明兩個總體不存在顯著差異,這裡通常是指位置上的差異。
對於單項有序表來說,也採用這種思想來比較兩組數據是否在位置上存在顯著差異。實際上是考察兩組所代表的不同的處理的效應是否存在顯著差異。
下面借用論文《單向有序列聯表的卡方檢驗和秩和檢驗的比較》中的案例來說明其檢驗過程。
例1:採用兩種不同的藥物來治療黃褐斑的療效見下表,問題是兩種不同的治療方式在療效上存在顯著差異嗎?
第一步:提出假設
H0:兩種治療方法的療效無顯著差別
Ha:兩種治療方法的療效有顯著差別
第二步:編秩
列聯表與連續數據秩和檢驗之間的差異在於相等的數據非常多,如「痊癒」有44例,如果從1開始賦秩,其秩就是1~44,因為這44例不存在先後順序,因此每一例都取平均秩,即(1+44)/2=22.5。下一個「顯效」的秩就要從45開始編到103,平均秩為(45+103)/2=74。以此類推,具體見下表的列(6)。當然你也可以從「無效」開始編秩。
第三步:計算各樣本的秩和T
各組的秩和就是各組每個水平的例數與本水平的平均秩相乘,然後相加。見下表的列(7)、(8)。
第四步:確定統計量
對於小樣本來說,通常會選擇一個樣本量較小樣本T值作為檢驗統計量,因為不可能採用正態分布來近似,需要用精確的概率計算。在總的秩和為n(n+1)/2中,用樣本量為n1的秩和T出現的概率以及小於此概率的所有概率之和作為p值,這是雙邊檢驗的情況。如果是單邊檢驗,則只加一邊的即可。
比如兩個樣本的樣本量分別為3、5,假如不存在相同的秩,從秩1~8中隨機抽3個秩,則有
種組合,因此每一種組合出現的概率為1/56,則3個秩之和出現的概率為
對於單邊檢驗來說,如果秩和等於6、7(備擇假設為小於),或等於20、21(備擇假設為大於),則可以拒絕原假設。以7為例,6和7出現的概率之和為2/56,小於我們設定的顯著性水平0.05。如果是雙邊檢驗,則只有出現6或21時才可以拒絕。
n當然這樣計算也太麻煩了,下面這張表把檢驗的上下限都標出來了,直接查表就可以了。這張表適用於較小的樣本量在10以內,且兩個樣本量之差在10以內的秩和檢驗。當然,如果不願意查表,直接交給軟體就行了。
表中可以看到剛才的例子中,在顯著性水平為0.05時,單邊檢驗的臨界值為7和20,雙邊檢驗的臨界值是6和21。
如果實際情況超出了表格的範圍,則可以用正態分布來近似。檢驗統計量因假設的不同而有所區別。設某一樣本(通常選樣本量較小的)的秩和為T,N=n1+n2,則檢驗統計量z分別為:
左側檢驗:
右側檢驗:
雙側檢驗:
其中tj為第j個結的個數,l為存在結的水平數。
本例中計算出:
修正的統計量為:
第五步:查正態分布表,或t分布表(自由度為∞),α=0.05時臨界值為1.645,因此拒絕原假設。即兩種治療方法療效顯著不同。
多樣本的Kruskal-Wallis H檢驗
在連續數據的比較分析中,一個和兩個樣本一般用t檢驗,而三個及以上就要用到單因子方差分析了。
單項有序表的檢驗中,兩個樣本用到Wilcoxon秩和檢驗,而三個及以上的樣本就要用到Kruskal-Wallis檢驗了,可見這種方法可以類別單因子方差分析。
雖然本文介紹的方法主要是針對列聯表的,但屬於非參數檢驗的範疇,這些方法對於連續數據同樣適用,在非參數檢驗單元中,大家還會看到它們。
與方差分析類似,Kruskal-Wallis檢驗被稱為Kruskal-Wallis方差分析,也是要計算離差平方和,不同的是這個平方和服從分布。
Kruskal-Wallis檢驗是由兩位統計學家於1952年提出的,下面我們還是用一個例子來介紹其分析思路。
例2:某公司將操作工的技能分為初級、中級、高級三級,人力資源部收集了四個生產車間員工數據,想知道四個車間的操作工構成是否存在顯著差異。
第一步:提出假設
H0:四個車間的操作工構成無顯著差別
Ha:至少有一個車間與其它車間不同
第二步:編秩
編秩方法與前面相同。
第三步:求秩和
計算每一組的秩和,計算方法與前面相同。
第四步:計算H統計量
熟悉方差分析的人看到這個公式,立刻就會意識到這是離差平方和的計算,後面的式子只不過是簡化以後的,比較方便計算。
同樣的,如果存在結,則需要加以修正。
本例的數據計算出H=12.6,Hc=15.4。
第五步:查分布表,自由度為組數-1,本例為4-1=3。取α=0.05,則臨界值為9.35,因此我們可以拒絕原假設,即四個車間操作工構成存在顯著差異。
如果拒絕原假設,下一步通常是多重比較,方法有很多種,放到非參數檢驗單元中介紹。
小樣本的分析思路與前面的Mann-Whitney檢驗類似,也需要通過查表,感興趣者可參閱相關教科書。
請關注我的微信公眾號:張老師漫談六西格瑪
推薦閱讀:
※在實際生產中怎麼通過MTM優化工時?
※請教關於minitab的問題?
※數據收集篇之七:測不準的幾種情形
※如何註冊六西格瑪黑帶?
※在讀博士期間考出six sigma有必要嗎?我主攻塑料工程