假設檢驗之二:假設檢驗的基本原理
看了前面的介紹,估計大家對假設檢驗的概念已經有了大致的理解,本篇重點介紹一下假設檢驗的兩個重要的理論基礎。
如馬逢時老師書中介紹的,假設檢驗的分析方法包含兩條基本的原理:帶概率性質的反證法原理和小概率事件原理。
帶概率性質的反證法原理
反證法(Proof by Contradiction),又稱為歸謬法、背理法。在證明數學問題時,先假定命題結論的反面成立,在這個前提下,若推出的結果與定義、公理、定理相矛盾,或與命題中的已知條件相矛盾,或與假定相矛盾,從而證明命題結論的反面不可能成立,由此斷定命題的結論成立。
反證法證明命題的一般步驟如下:
1.假設結論的反面成立,即反設;
2.由這個假設出發,經過正確的推理導出矛盾,即歸謬;
3.由矛盾判定假設不正確,從而肯定命題結論正確,即結論。
這三個步驟中,歸謬是最重要的,常見的歸謬包括這三類:與已知條件矛盾;與已知的公理、定理、定義矛盾;自相矛盾。
在數學中,是無理數就是用反證法證明的。證明過程如下:
第一步,反設:如果是有理數,則必有
其中p,q是互質的正整數。
第二步,歸謬:兩邊平方,則有
則p為偶數,設p=2r,則有
則q也是偶數,這與p、q互質矛盾。
第三步,結論:因此假設不成立,是無理數。
反證法是數學中常用的方法,德國數學家希爾伯特就說:「禁止數學家使用反證法,就像禁止拳擊手使用拳頭。」
假設檢驗所使用的反證法與此最大的不同點是帶有概率,即用概率來判斷命題是否成立。費歇爾老先生在提出顯著性水平檢驗時,先假設總體的參數,這就是原假設(Null Hypothesis),如小麥的植株高度往年統計的均值為90cm。今年要對種植結果進行驗證,在驗證之前假設總體均值仍然是90cm,然後抽樣檢驗。如果今年的小麥植株高度還是90cm,那麼樣本的均值應該與90cm差不多,如果差得很遠,比如105cm,或者只有70cm,抽樣結果就顯得很不合理,因此就可以推翻原假設,即今年的小麥植株高度不是90cm。但是這種判斷是存在出錯可能的,因為即使今年的植株高度還是90cm,但植株高度是服從某種分布的,有可能會抽出大於105cm或小於70cm的樣本的,雖然這個概率很小。因此在費老先生所提出的顯著性水平檢驗中,所運用的反證法是帶有概率的,也就是說對於抽樣結果的判斷是有出錯的可能性的。
注意費歇爾並沒有告訴你拒絕原假設後你應該接受什麼,而奈曼-皮爾遜則在此基礎上給出了第二個假設,即備擇假設(Alternative Hypothesis)。這個假設是與原假設相對立的,在拒絕原假設的同時可以接受備擇假設。
讓我們用一個古老的例子來理解一下反證法在假設檢驗中的應用。
王戎七歲,嘗與諸小兒游,看道邊李子樹多子折枝,諸兒競走取之,唯戎不動。人問之,答說曰:「樹在道邊而多子,此必苦李。」取之信然。
——南朝·宋·劉義慶《世說新語·雅量》
這個王戎,就是大名鼎鼎的竹林七賢之一,就像人們常認為的那樣,成功的人總是能發現其在幼小時所展示出的過人之處。王戎和他的小夥伴們都是利用了反證法,但其假設卻相反。王戎的原假設是李子苦,而小夥伴們假設李子甜。王戎先反向假設李子是甜的,然後推理出李樹在路邊但卻有很多的果子與常理不符,因此李子是苦的。而小夥伴們則是嘗了以後發現李子是苦的,從而推翻原假設。兩方的判斷都有判斷錯誤的可能,王戎可能出錯的地方是那些李子確實是甜的,但那時的人都道德高尚,不吃嗟來之食;小夥伴們出錯之處可能是恰巧摘了一顆苦李,而其它的李子都是甜的。因此這個故事也屬於運用了帶有概率的反證法。
運用反證法進行假設檢驗有一個重要的特徵,即拒絕是有說服力的,這種說服力來自於上述的抽樣結果不合理。如果結果不合理,則說明有足夠的證據說明原假設是錯誤的,可以拒絕原假設,而接受備擇假設;如果看不到明顯的不合理,則表明沒有足夠的證據證明原假設是錯誤的,但也不能說原假設就一定成立,因為沒有能夠證明原假設成立的證據。因此費歇爾說:永遠不要說接受原假設。
小概率事件原理
如何判斷抽樣結果是不是不合理呢?費歇爾老先生提出了p值這個概念,用來表示在原假設成立的條件下,抽樣結果的不合理和更不合理的概率。他還給出了一個判決點,即0.05,費歇爾p值小於1/20就足以拒絕原假設了。
0.05是足夠小的概率,一般認為,在一次抽樣(試驗)中,小概率事件幾乎不可能發生,如果出現發生了,則說明事先的假設是錯誤的。但小概率事件並不是一定不會發生,當抽樣次數足夠多時,小概率事件是一定會發生的。這說明即使是一次抽樣,小概率事件仍有可能發生,也就是說存在判斷錯誤的可能性。
在標準的假設檢驗中,對判錯的概率進行了定義,這就是α和β風險,後面詳細介紹。
請關注我的微信公眾號:張老師漫談六西格瑪
推薦閱讀:
※數據收集篇之十二:GR&R中的ANOVA問題答案
※數據收集篇之十六:EMP分析步驟
※經典比較篇之十:要收集多少數據才能做有效比較?
※假設檢驗之五:α風險 vs. β風險
※精益生產?不是在問題。?