Mann Whitney U test中為什麼單尾檢定是比較alpha,而雙尾是比較alpha/2呢?

雙尾檢定和單尾檢定的H0是同一個,即「兩個母體的分布沒有顯著差異」,而H1不一樣,雙尾檢定的H1是「母體1和母體2的分布不同」;右尾檢定的H1是「母體1的分布位於母體2的右邊」;左尾檢定的H1是「母體1的分布位於母體2的左邊」。

對於雙尾檢定來說,判定是否reject H0的標準,是查看p-value是否小於alpha/2;而單尾檢定是查看p-value是否小於alpha。為什麼一個要除以2,另一個不用呢?這樣引起的困惑是,例如:

某次檢定做出來p-value是0.038,而alpha設定為0.05。那麼是否reject H0,現在看起來好像是取決於實驗者決定做雙尾還是單尾檢定了,如果決定做雙尾,那麼就不拒絕H0;但決定做單尾的話,就拒絕H0了。可是「母體1與母體2分布是否相同」,明明是同一個事實。

另外,如果已經確定拒絕H0,那麼母體1的分布到底在母體2的左邊,還是右邊呢?怎樣判斷呢?


謝邀。

單邊假設檢驗和雙邊假設檢驗的內容是不同的,同時這個問題試用於所有檢驗。

先舉個例子,具體的分析會不斷添加。

雙邊假設:男人的總體平均身高與女人的不同。 (H0: Umale = Ufemale. Ha: Um 不等於 Uf) 在不知道總體方差的情況下統計量往往選用兩樣本t statistic. 簡單來說,當你的樣本顯示男人的身高【顯著】高於女人,拒絕原假設。同時,對於雙邊假設,當你的樣本顯示女人的身高顯著高於男人,同樣拒絕原假設。

單邊則不同。比如你預期男人身高應該更高,則H0: Um &< Uf. H1: Um &> Uf .只當樣本顯示男人的身高顯著大於女人時拒絕原假設。

如果兩者事先第一類錯誤概率alpha 都是0.05, 那麼根據假設的不同,雙邊要分到兩邊一邊一半,單邊只保證一邊。

兩個檢驗的統計量差個絕對值 , pvalue相等恰恰代表兩者情況不同相同。圖片和實例會解釋的更清楚,會在以後更新。


謝邀。

其實簡單來說,我覺得題主問出這個問題還是沒有弄明白做Hypothesis Test到底是在做什麼。

首先,One Tail Test不僅僅是會出現在Mann Whitney U test中,所有基於對稱的分布而上的Test都會有。而相反,對於一些非對稱的分布,比如Chi-Square或者F-Distribution的分布,就不存在這個問題了。對於這些分布,只有Two-Tail的Test.

第二,說說Hypothesis Test。剛開始學的時候我也是非常痛苦的表示這玩意兒到底在幹啥啊。統計是個很奇妙的東西,就算你不懂,你也可以跟著流程走,然後得出結論,但是其實內心完全不懂這一套流程在做什麼。

為了理解到底Hypothesis Test在做什麼,我們先假定下列的情景(就接著樓上這位哥們兒的身高問題)

  1. 我們假定要測量中國成年男性的平均身高,並且假定這個身高是μ1.
  2. 為了得出這個身高到底是多少,我們當然不可能逐個把中國的成年男子們拖出來量身高。那麼我們怎麼做!抓壯丁做樣本啊(Sampling)。當然具體怎麼sample還是門大學問,這個暫且不說。
  3. 那麼我們sample出來的數據,得到了一個平均身高,我們稱他為x-bar。

好了,現在問題出來了。我們從過往的數據中得出了中國男性的平均身高為μ2.我們怎麼比較x-bar 和 μ2是不是一樣的呢?

Sample出來的數據總是不可能100%等於真是的Population的數據的。比如,我們取樣出來的人口身高數據是169.8(x-bar),但是我們從之前的數據中得出的數據是170.0 (μ2). 那麼我們能說他們不一樣么?看起來很接近,其實感覺上應該沒差是吧。那麼169.3還一樣嗎?169.2呢?160呢?我們怎樣設定一個可以接受的區間或者說是範圍來決定怎樣的數據可以接受呢?

於是我們就發明了Hypothesis Test,基於每個Population都會有variation,也就意味這每個數據都有其發生的概率。比如說對於平均身高170.0的population,168.0的概率是多少呢?如果我們把所有的數據發生概率大小都畫在一個圖裡面,我們會得到如下的圖 (暫且先用個正態分布。。。不想手畫了)

假設這是Population的分布圖,中間那條線代表我們假定的均值(μ2)。那麼,我們想問的問題是,x-bar在這個population中出現的概率是多少。從圖上可以看到,如果出現的概率特別低,那麼x-bar會出現在這個圖上偏尾巴的部分,而這個尾巴部分所代表的面積就是我們所謂的alpha。也就是說,如果x-bar出現的位置是代表他發生的概率非常低,那麼我們假定應該不屬於這個population裡面了。但是同時注意,我們可以看到上面的分散式無限向正負無窮延伸的,那麼也就是說無論多麼大或小的值都是可能本身屬於這個population的。而這部分『本身可能屬於』的概率就是我們所謂的Alpha,所以同時這也是Type I Error的來源。換句話來說,Alpha是我們可以接受的錯誤率。

那麼回到題主的問題。

對於一個Two-tail的test,我們認定在中心值兩邊的情況都認為是Significantly Different。那麼也就是說,對於一個可接受的錯誤範圍(假定5%),那麼兩邊都要均分可能的錯誤率。那麼就是2.5%。

而對於一個One-Tail的test,我們只關心μ1是不是大於或小於μ2,所以只涉及了一邊的概率,也就是一邊的尾巴可以享受整整一個5%!yeah!

套用之前的栗子。

如果平均Population的平均身高是170.0,對於一個Two-tailed Test,我們關心他們是不是相等。也就是說不管x-bar是在170以上還是以下,都是我們的考慮範圍(比如對於alpha=0.05,我們得出的區間是168.0 ~ 172.0)170的兩邊都分走了一半的錯誤率。

而對於One-tailed Test, 我們只關心x-bar是不是大於(or小於) 170,所以所有的錯誤率都可以放到圖上的一個尾巴上。

這也就是為什麼對於一個Two-tailed test,我們會需要alpha/2.

順手回答一下題主這句話

另外,如果已經確定拒絕H0,那麼母體1的分布到底在母體2的左邊,還是右邊呢?怎樣判斷呢?

如果是一個Two Tailed的Ho,你的問題核心是『是否等於』。那麼到底在左邊還是右邊已經不是你的研究問題了。所以判斷無意義。

如果想知道怎麼辦,重新開始做一遍One Tailed Test,雖然數據會一樣,但是代表了你的研究問題改變。

夾了點英文,因為我真的不知道有的術語怎麼&>。&<見諒,勿噴。


某次檢定做出來p-value是0.038,而alpha設定為0.05。那麼是否reject H0,現在看起來好像是取決於實驗者決定做雙尾還是單尾檢定了,如果決定做雙尾,那麼就不拒絕H0;但決定做單尾的話,就拒絕H0了。可是「母體1與母體2分布是否相同」,明明是同一個事實。

我想知道這個應該怎麼解釋


推薦閱讀:

陌陌 2015 年第三季度月度覆蓋人數 5838.1 萬。請問我從沒遇見過一個陌陌用戶的概率?
全國各地的啟功先生題字、題名,大約有幾成為真?
求問一道概率題,6個小孩有6條狗,我隨機的把狗給小孩,全部錯誤(即沒有一隻狗找到主人)的概率是多少?
如果我們真的要在大海里撈根針,該怎麼辦?
生存數據的左右截尾是什麼?請舉例說明。

TAG:統計學 | 統計 | 社會統計學 |