數據收集篇之十二:GR&R中的ANOVA問題答案
上一篇問題是由公眾號里的一個朋友提出的,其實很早以前我就關注過這個問題,但一直沒有做過深入的探究,畢竟我培訓過的絕大多數學員對此不會深究。另外在GR&R分析中通常不太關注ANOVA,一般都是直接看方差分量的大小和比例。另一方面也是我對此沒有答案,所以撰文求助。參見《問題征解:MSA的ANOVA分析問題》
在留言中,啟明先生提出到《試驗設計與分析》中尋找答案,為我指出了方向,秦波老師明確要考慮SOV的思路,這給了我很大的啟發,於是我翻開了手頭王萬中的《試驗的設計與分析》(不是啟明先生推薦的那本書)。看書期間看到了Simon的長留言,請允許我拷貝在此:
「為什麼minitab和jmp算主效應的F值是比上交互作用MS?是因為MSA是隨機效應模型,理論上交互作用的MS期望包含了重複性MS的期望,主效應MS的期望又包含了交互作用MS的期望,所以如果主效應MS比的是重複性MS,F值顯著,你並不能判斷到底是因為主效應顯著還是交互作用顯著,所以比交互作用MS比較好。第二為什麼AIAG那個例子用的是主效應MS比上重複性MS?因為雖然交互作用MS的期望一定包含(大於)重複性MS的期望,但在實際中我們是拿樣本算出來的各個MS去估計各個MS的期望,所以有時候會出現樣本算出的交互作用MS小於重複性MS的情況,這時候算主效應的F值用主效應MS比上重複性MS更精確。最後總結一下,在隨即效應模型裡面算主效應F值,如果樣本交互作用MS大,用它,如果重複性MS比交互作用MS還大,用重複性MS。」
Simon先生的說法讓我茅塞頓開,結合書中的描述,我認為已經找到了答案。
在此向啟明先生、秦波老師、Simon先生表示誠摯的感謝,雖然我們從未謀面,但你們的認真且專業的回復給了我非常大的幫助。當然財物上的感謝就沒有了,畢竟我這個公眾號也是不賺錢的。
下面談談我探究的結果。
測量系統分析是一個集合了非常多統計方法的試驗設計方法,幾乎所有我們所學的統計方法在其中都有應用。偏倚的顯著性採用比較分析(通常稱假設檢驗),偏倚的線性採用回歸分析,穩定性採用控制圖分析,重複性則採用方差分析,而且還是隨機效應的SOV分析。另外別忘了,測量系統分析是一種試驗設計——它並不是基於過程數據的分析方法,而是需要事先進行周密設計和計劃的試驗。
有意思的是,如此複雜的一個統計工具居然是我們學習六西格瑪時首先要學的,而其中用到的方法並沒有事先引入。如果在學習之前沒有學過這些知識,在理解上就會面臨很大的困難。很多人在後面逐漸學到相關的方法時才會有似曾相識或恍然大悟的感覺。
一般老師在講授這一部分內容時也會有些無奈,既不能不作解釋,也不能過多解釋,大多情況下會告訴學員以後會學到原理,這裡大家先學會使用即可。但這樣會使學員領會不深,把握不準,實際應用時也會遇到各種各樣的困難。知道這一點,大家就會理解為什麼藍皮書要將測量系統分析放到假設檢驗、回歸分析、變異源分析之後了。
談了這麼多背景,現在進入正題。下面描述的原理主要來自華東師範大學王萬中教授主編的《試驗的設計與分析》第二章,就是這一本。
首先要解釋一個重要的概念,即固定效應模型和隨機效應模型。在書中是如此解釋的:
如果因子A的a個水平和因子B的b個水平是根據試驗者的主觀意圖在試驗前就指定好的,並且在試驗過程中得到很好的控制,這種情況下的統計模型稱為固定效應模型。……,檢驗結論只適用於試驗所使用過的因子A的各個水平和因子B的各個水平,而不能推廣到試驗未使用過的水平。
如果因子A和B的水平都很多或有無限多個,而參與試驗的A的a個水平是從因子A的全部可能的水平的總體中選取一個容量為a的隨機樣本,B的b個水平是從因子B的全部可能的水平的總體中選取一個容量為b的隨機樣本,這種情況下的統計模型稱為隨機效應模型或方差分量模型。……,對隨機效應模型作統計分析所得到的結論是相對於因子A的全部水平和因子B的全部水平而言的,而不管它們在試驗中是否被使用過。
在GR&R中,通常默認採用隨機效應模型。但在實際試驗過程中,則經常會違背這個模型的要求,比如特意挑幾個較熟練的檢驗員,或者隨便找幾個有空的檢驗員,這就違背了隨機抽樣的原則,分析的結果是有偏的。有時某種特性的測量只有3個檢驗員,屬於固定因子,但仍以隨機模型來分析。甚至有的時候檢驗員不夠,隨便拉個人來湊數。還有的特性測量屬於在線自動測量,在分析時明明只有重複性,但為了湊上再現性還有硬拉上幾個人來裝模作樣地測一下。這些都是MSA中常見的問題,在做的時候要儘可能避免。
以下內容沒學過SOV的可能有點難懂,學過的一眼就能看明白了。
設試驗中因子A隨機抽樣a個水平,因子B隨機抽樣b個水平,兩因子各水平組合下重複m次試驗,總試驗次數為abm次。A因子的第i個水平與B因子的第j個水平組合下的第k次試驗的結果記作yijk,i=1,…,a,j=1,…,b,k=1,…,m。這是一個隨機效應模型。
試驗的線性統計模型是
其中μ為總均值;τi =μi-μ為A因子第i水平下均值與總均值之差,服從N(0,στ2);βj
=μj-μ為B因子第j水平下均值與總均值之差,服從N(0,σβ2);(τβ)ij為交互效應,服從N(0,στβ2);εijk為隨機誤差,服從N(0,σ2)。在此模型下,任一觀察值的方差是
式中右邊各方差稱為方差分量。
方差分析需要檢驗的假設是
此假設可以轉換成這樣
跳過離差平方和的分解過程,各因子的期望均方為
看到這裡,估計大家已經明白計算F值時為什麼要除以交互效應了。各因子的主效應均包含交互效應,如果是主效應除以隨機誤差,則交互效應會影響主效應顯著性的判斷,因此除以交互效應是合理的。在H01、H02、H03分別成立時,則
三個F應該接近於1,而拒絕域是右側單尾的。
對於固定效應模型(具體模型不再贅述,各位可查閱相關的書籍)而言,各因子的期望均方為
因子的期望均方中並沒有包含交互效應,因此對於固定效應模型來說,F值都是除以隨機誤差。
從前面的描述中可以看出,兩個因子的期望均方要大於等於交互效應,交互效應的期望均方要大於等於隨機誤差。實際應用中會出現與此不一致的現象,這是隨機抽樣造成的。通常在交互作用不顯著時,將其併入隨機誤差,也就是Simon所說的第二點。
請關注我的微信公眾號:張老師漫談六西格瑪推薦閱讀:
※數據收集篇之十六:EMP分析步驟
※經典比較篇之十:要收集多少數據才能做有效比較?
※假設檢驗之五:α風險 vs. β風險
※精益生產?不是在問題。?