經典比較篇之六:單總體比較中如何做假設?
單樣本檢驗,我在學習的時候稱為One to Standard Comparison,意為一個總體與標準值的比較。這個標準值經常會引起誤解,我在項目諮詢過程中就發現有不少用錯的地方。在知乎上也有一些關於單樣本檢驗中原假設的困惑,如「在假設檢驗中,為什麼把原來的狀態設為原假設?」今天就這個問題談談我的理解。
nn說到單總體比較的假設,問題比較突出的是如何確定原假設。在兩總體的比較中,確定原假設非常簡單,總是兩總體均值相等,而單總體比較中,原假設具體如何取值卻有一些講究。
nn以我的理解,原假設取值來自以下幾種途徑。
nn
1.理論值
nn這個值來自科學研究或產品開發中,運用物理、化學等等專業學科的原理計算出的值,這個理論值需要通過試驗來確認其正確性。因在試驗過程中會存在一些不可控的變數,試驗結果會呈現出波動性,因此需要用比較分析來進行確認。這時候原假設就是這個理論值,而備擇假設就是試驗獲得的樣本數據參數。
nn2.規範值
nn這是最常見的取值方法。在工業上,通常需要對部件的參數,如尺寸、質量、容積、位置等等提出規範,即眾所周知的規格限,以便用部件方便地組裝成一個產品。這些規格限通常包括規格上限和規格下限,一般取規格限的中心點為目標值,如孔徑規格為10mm±0.02mm。我們知道規格限代表客戶需求,這是不容變化的,除非客戶要求改變設計,而加工過程中總會出現波動,因此需要驗證實際加工的結果是不是達到目標值。在這種情況下,原假設取值要採用目標值。
nn
但在服務、管理等領域,通常其規範只給出規格上限或下限,即單邊規格限,如麥當勞規定客戶付款後拿到食物的時間不能超過1分鐘。但這種規格通常不會給出目標值,因此很難確定原假設的取值。
nn很顯然,你不能把規格限當成目標值,因為如果檢驗結果是實際均值等於目標值,就相當於有50%的實際值超出規格限,計算出的Cpk值為0。你可能會問,目標值怎麼設定呢?在麥當勞的例子中能不能把目標值設定為0.5分鐘呢?說實話我也沒有答案,這需要實際測算並協商確定。一般在這種情況下我不建議用比較來進行分析,計算Cpk會更恰當一些。
nn3.歷史信息
nn通常我們會對製造或服務過程做優化改造,比如用機器人代替人工操作,用鋁材替代鋼材,用新的三步操作法代替原有的吳堡操作法等等。在這種情況下,原有的狀態已經蓋棺定論,不會改變了。此時可以假定我們所獲得的歷史信息是總體信息,而運用比較分析的目的是確認過程改變後的狀態與之前的狀態是否存在顯著差異。歷史信息是比較的對象,是個已知值,因此需要將其設定為原假設。
nn看到這裡你可能有個疑問,很多歷史信息也是抽樣得來的,怎麼能說是總體信息呢?大多數情況是這樣的,但你也不妨就把它當成總體,反正你也不可能再回去收集總體信息了。
nn
另外一個疑問是,既然歷史信息是抽樣得來的,是不是可以用雙樣本檢驗來進行比較呢?當然可以!數據是死的,但人是活的,不要成為工具的奴隸。
nn4.別人的研究成果
nn這在科學研究中常用。在科學研究中,一項研究成果通常會以論文的形式發表,其中包括其研究方法和結論。其他的研究者可以據此做重複的試驗,驗證是否能夠得到相同的結果,比如去年鬧得沸沸揚揚的韓春雨時間就屬於這一類。在重複試驗中,韓春雨論文的結果就是原假設,世界上其他做重複試驗的科學家的結果就是備擇假設。
nn以上是我的一點粗淺認識,拿出來與各位同好分享,各位有什麼好的意見,不妨拿出來一起討論討論。
請關注我的微信公眾號:張老師漫談六西格瑪
推薦閱讀:
※數據收集篇之十五:評估測量過程EMP——一種測量系統分析的新方法
※抽樣分布篇之一:隨機變數分布vs抽樣分布
※可靠度|談談環境應力篩選
※列聯表篇之三:比率的多重比較
※淺談內審員的素質和審核技巧