如何理解假設檢驗
本文主要內容:
- 什麼是假設檢驗?
- 如何進行假設檢驗
- 假設檢驗實例
1什麼是假設檢驗?
大多數情況下,我們無法分辨事物的真偽或者某種說法的是否正確,這時就需要進行假設,
然後對我們的假設進行檢驗。
例如:在犯罪審判中,假設被告人是清白的,推論統計學上定義為零假設H0(原假設),那麼與其對於的是備擇假設H1——被告人是有罪的。
那麼接下來我們就要對我們的假設進行檢驗,收集樣本信息(證據),如果樣本信息與被告人清白這一假設不相符,那麼拒絕H0假設,即可認為被告人有罪。
許多情況下,關於H0和H1的選擇並非顯而易見,必須要進行判斷
假設檢驗過程中,不可能做出的結論總是正確的,必須要考慮誤差的概率,假設檢驗中將可能反生錯誤分為兩類:第一類錯誤,第二類錯誤
- 第一類錯誤: 零假設h0實際上是真的,但被假設驗證為假的,犯了第一類錯誤
- 第二類錯誤: 零假設h0實際上是假的,但被假設驗證為真的,犯了第二類錯誤
通常,將在假設檢驗是所指定的發生第一類錯誤的概率的最大容許值稱為檢驗的顯著水平,一般選擇顯著性水平為5%和1%。
一般情況下,考慮控制假設假設檢驗的顯著水平大小來降低第一類錯誤的概率,顯著水平越小,發生錯誤的概率就越低。
2 如何進行假設檢驗?
一個重要概念:p值 :用於確定我們是否拒絕H0,是一個概率值,如圖當P值小於顯著水平時,說明檢驗的統計量落入拒絕域中,拒絕零假設。
假設檢驗的步驟
- 確定要檢驗的假設
- 選擇檢驗統計量
- 確定拒絕域
- 求出檢驗統計量的p值
- 查看樣本結果是否位於拒絕域
- 做出決策
3 假設檢驗實例
一個著名的栗子:神經學家要測試一種藥物對反應時間的效果,分別對100隻老鼠注射一單位劑量的藥物然後對其進行神經刺激,然後記錄反應時間,已知沒有注射藥物的老鼠的平均反應時間為1.2秒,結果測出:100隻注射藥物的老鼠的平均反應時間為1.05秒,(樣本的標準差為0.5S)
當你看到這個結果,你是否信任這個結果?
來讓我們通過假設驗證,根據假設驗證的基本步驟
1、確定要檢驗的假設
零假設H0:藥物對反應時間無效果 平均反應時間為
備擇假設H1: 藥物對反應時間有效果, 平均反應時間為
2、選擇檢驗統計量
樣本大小為100>30 ,樣本容量為大樣本,且呈正態分布,樣本的標準差為S = 0.5,平均值為1.2
根據中心極限定理可知,樣本的均值也符合正態分布,是對總體的均值進行假設檢驗,用樣本的標準差來估計總體的標準差 ,通過z統計量值來檢驗
根據公式 ,樣本的均值 ;樣本的 標準誤差 , 總體的均值 ,求出z =-3,說明了樣本的均值距離 有三個標準差
3、確定拒絕域
取顯著水平為0.05,本次為單尾檢測,根據0.025的概率,查Z表格,可知臨界值Z = -1.96
4、求出檢驗統計量的p值
根據經驗法則 3個標準差內的概率是99.7%,考慮更為極端情況的概率p= 1-99.7% = 0.003
也可以根據z =-3,查出p的概率
5、查看樣本結果是否位於拒絕域
p值0.0015 < 0.025,在拒絕域內,拒絕零假設
6、做出決策
如果零假設成立,只有不到1/600的幾率得到,幾率非常小,所以拒絕零假設,藥物對反應時間有效果 。
推薦閱讀:
TAG:假設檢驗 |