SPSS超詳細操作：兩因素多元方差分析(Two-way Manova)

05-03

醫咖會在之前的推文中，推送過多篇方差分析相關的文章，包括：

單因素方差分析(One-Way ANOVA)
雙因素方差分析(Two-way ANOVA)
三因素方差分析(Three-way ANOVA)
單因素重複測量方差分析
兩因素重複測量方差分析
三因素重複測量方差分析
單因素多元方差分析(One-way MANOVA)

每種方差分析的應用場景，以及該如何進行SPSS操作和解讀結果，各位夥伴請點擊相應的文章鏈接查看~~今天，我們再來介紹一種統計方法：兩因素多元方差分析(Two-way Manova)。

一、問題與數據

某研究者想研究三種干預方式（regular—常規干預；rote—死記硬背式干預；reasoning—推理式干預）對學生學習成績的影響。

研究者記錄了學生兩門考試的成績：文科成績（humanities_score）和理科成績（science_score）。另外，基於之前的知識，研究者假設干預方式對男女兩種性別學生的效果可能不同。換言之，研究者想知道不同干預方式對學習成績的影響在男女學生中是否不同。也就是說，干預方式和性別兩個自變數之間是否存在交互作用（interaction effect）。

註：交互作用是指某一自變數對因變數的效應在另一個自變數的不同水平會不同。在本例中，就是要比較①男性中干預方式對學習成績的影響和②女性中干預方式對學習成績的影響。這兩個效應就成為單獨效應（simple main effects），也就是說，單獨效應是指在一個自變數的某一水平，另一個自變數對因變數的影響。因此，交互作用也可以看做是對單獨效應間是否存在差異的檢驗。

在本研究中，共有三個效應：性別的主效應；干預方式的主效應；性別和干預方式的交互作用。

研究者選取30名男學生和30名女學生，並將其隨機分配到三個干預組中，每個干預組中共有10名男學生和10名女學生。部分數據如下：

二、對問題的分析

使用兩因素多元方差分析法進行分析時，需要考慮10個假設。

對研究設計的假設：

1. 因變數有2個或以上，為連續變數；

2. 有兩個自變數，為二分類或多分類變數；

3. 各觀察對象之間相互獨立；

對數據的假設：

4. 自變數的各個組內，各因變數間存在線性關係；

5. 自變數的各個組內，各因變數間沒有多重共線性；

6. ①沒有單因素離群值（univariate outliers）與②多因素離群值（multivariate outliers）：單因素離群值是指自變數的各個組中因變數是否是離群值；多因素離群值是指每個研究對象（case）的各因變數組合是否是一個離群值；

7. 各因變數服從多元正態分布；

8. 樣本量足夠；

9. 自變數的各組觀察對象之間因變數的方差協方差矩陣相等；

10. 每個因變數在自變數的各個組中方差相等。

三、流程圖

四、對假設的判斷

那麼，進行兩因素多元方差分析時，如何考慮和處理這10個假設呢？

由於假設1-3都是對研究設計的假設，需要研究者根據研究設計進行判斷，所以我們主要對數據的假設4-10進行檢驗。

(一) 檢驗假設6：①是否存在單因素離群值；假設7：各因變數是否服從多元正態分布

檢驗單因素離群值時需要檢驗每一種自變數的排列組合中是否存在離群值，共有如下6種情況：

1. 首先要對數據進行拆分

(1) 在主菜單點擊Data > Split File... ，如下圖：

(2) 出現Split File對話框，選擇Organize output by groups，會激活下方Groups Based on: 框；

(3) 將gender和intervention選入Groups Based on: 框中，點擊OK；

2. 運行Explore程序，檢驗離群值並評估正態性；

(1) 在主菜單點擊 Analyze > Descriptive Statistics > Explore... ，如下圖：

(2) 出現Explore對話框；

(3) 將humanities_score和science_score選入Dependent List中，將id選入Label Cases by：框中；

(4) 點擊Plots，出現下圖Plots對話框；

(5) 在Boxplots下選擇Dependents together，去掉Descriptive下Stem-和-leaf，選擇Normality plots with tests，點擊Continue，點擊OK。

3. 檢驗假設6：①是否存在單因素離群值

(1) 下圖為輸出的箱式圖結果。

在SPSS中，將距離箱子邊緣超過1.5倍箱身長度的數據點定義為離群值，用「圓圈」表示，右上標為離群值在數據表中所對應的行數，以圓點表示；將距離箱子邊緣超過3倍箱身長度的數據點定義為極端值（極端離群值），用「*」表示，右上標代表離群值在數據表中所對應的行數。

在下圖中，可以看到兩個單因素離群值：a）26號學生，在推理干預組的一位女學生文科分數高於同組內的；b）57號學生，在推理干預組中的一個男學生文科分數也是高於同組內的。

(2) 本例中沒有出現極端值，為了方便理解，下圖是出現極端值的一個舉例的情況。

一般來說，極端值比離群值更難處理。但是出現離群值時就應該檢查離群值，並決定選擇處理方法。本例中雖然存在離群值，但是為了進行下一步，我們暫且認為不存在離群值。

(3) 離群值的處理

首先需要確定離群值出現的原因，數據中存在離群值的原因有3種：

1) 數據錄入錯誤：首先應該考慮離群值是否由於數據錄入錯誤所致。如果是，用正確值進行替換並重新進行檢驗；

2) 測量誤差：如果不是由於數據錄入錯誤，接下來考慮是否因為測量誤差導致（如儀器故障或超過量程），測量誤差往往不能修正，需要把測量錯誤的數據刪除；

3) 真實存在的離群值：如果以上兩種原因都不是，那最有可能是一種真實的極端數據。這種離群值不好處理，但也沒有理由將其當作無效值看待。目前它的處理方法比較有爭議，尚沒有一種特別推薦的方法。

需要注意的是，如果存在多個離群值，應先把最極端的離群值去掉後，重新檢查離群值情況。這是因為有時最極端離群值去掉後，其他離群值可能會回歸正常。

離群值的處理方法分為2種：

1) 保留離群值：

對因變數進行數據轉換；
將離群值納入分析，並堅信其對結果不會產生實質影響。

2) 剔除離群值：

直接刪除離群值很簡單，但卻是沒有辦法的辦法。當我們需要刪掉離群值時，應報告離群值大小及其對結果的影響，最好分別報告刪除離群值前後的結果。而且，應該考慮有離群值的個體是否符合研究的納入標準。如果其不屬於合格的研究對象，應將其剔除，否則會影響結果的推論。另外，需要在結果部分報告對離群值處理的方式。

4. 檢驗假設7：各因變數是否服從多元正態分布

(1) 對於樣本量較小（<50例）的研究，推薦使用Shapiro-Wilk方法檢驗正態性。當P<0.05（顯著性水平為0.05時）時，認為不是正態分布。

本例中，共有六種自變數的分類組合和兩個因變數，所以會出現12行結果。由於對各因變數進行了6次檢驗，所以新的顯著性水平 = 0.05 ÷ 6 = 0.0083。本例中，由於所有的P值都大於0.0083，所以兩個因變數文科成績和理科成績服從正態分布。

(2) 不服從正態分布的處理

如果數據不服從正態分布，可以有如下3種方法進行處理

1) 數據轉換：對轉換後呈正態分布的數據進行方差分析。當各組因變數的分布相同時，正態轉換才有可能成功。對於一些常見的分布，有特定的轉換形式，但是轉換後的數據結果可能較難解釋。

2) 直接進行分析：由於多元方差分析對於偏離正態分布有一定的抗性，尤其是在各組樣本量相等或近似相等的情況下，而且非正態分布實質上並不影響犯I型錯誤的概率。因此可以直接進行檢驗，但是結果中需要報告對正態分布的偏離。

3) 如果想知道不服從正態分布是否會影響方差分析的結果，可以比較轉換後數據的分析結果和直接進行分析的結果，如果兩個結果是同樣的結論，則不需要對因變數進行轉換。

(二) 檢驗假設4：自變數的各個組內，各因變數之間存在線性關係

1. 在上述數據拆分的基礎上，在主菜單下點擊Graphs > Legacy Dialogs > Scatter/Dot....，如下圖所示：

2. 出現Scatter/Dot對話框，如下圖所示；

3. 點擊Matrix Scatter，點擊Define，出現 Scatterplot Matrix對話框；

4. 將humanities_score和science_score選入Matrix Variables：框中，將intervention選入Rows：框中，將gender選入Columans：框中，點擊OK；

5. 在如下結果中可以看到每一種自變數組合里humanities_score和science_score的散點圖，除了兩因變數在推理干預的女學生中的線性關係不是很理想，其他組的線性關係明顯，我們這裡接受假設4。

如果不存在線性關係，可以通過3種方式進行處理：(1) 對1個或多個因變數進行轉換；(2) 去除掉不存在線性關係的因變數；(3) 直接進行分析，儘管統計效能會降低。

(三) 檢驗假設5：各因變數之間是否存在多重共線性

1. 在上述數據拆分的基礎上，在主菜單下點擊 Correlate > Bivariate...，如下圖所示：

2. 出現Bivariate Correlations對話框，如下圖；

3. 將humanities_score和science_score選入Variables，點擊OK。

4. 結果如下圖所示，可以看到自變數的各個組合中humanities_score和science_score的Pearson相關係數。

理想狀態下，在做多元方差分析時，各個因變數之間應該存在一定程度的相關關係，但相關性不能太強，如果相關性太強（高於0.9），則存在多重共線性，多元方差分析的假設則不再滿足。

在下表中突出顯示的相關係數在-0.851~0.721之間，因變數間不存在多重共線性（|r| < 0.9）。

5. 存在多重共線性的處理方法

如果數據具有多重共線性，可以有如下2種方法進行處理：

(1)刪除具有多重共線性的一個因變數，也是最常用的方法；

(2)可以通過主成分分析將具有多重共線性的多個因變數匯總成一個新的因變數，這樣做往往是理論上必須保留所有因變數。

(四) 檢驗假設6：②是否存在多因素離群值

多因素離群值是指因變數的組合是異常值。可以通過計算馬氏距離（Mahalanobis distance）來判斷某個研究對象是否為多因素離群值。

1. 在主菜單下點擊 Analyze >Regression >Linear...，如下圖所示：

2. 出現Linear Regression對話框，將id選入Dependent框中，將humanities_score和science_score選入Independent(s)中，如下圖所示；

3. 點擊Save，出現Linear Regression：Save對話框，點擊Distances下的Mahalanobis，即馬氏距離，點擊Continue，點擊OK。

4. 在主界面下，可以看到出現新變數MAH_1；

5. 選中MAH_1變數，右鍵，選擇Sort Descending，對新變數進行降序排列；

6. 如下圖所示，是對馬氏距離降序排列後的數據界面；

7. 馬氏距離需要根據下表中Critical Value進行對比，下表中Critical Value是在α=0.001時不同變數數對應的卡方分布的卡方值，由於本例中因變數有2個，對應的Critical Value為13.82，而本例中馬氏距離最大值為5.21444<13.82，所以不存在多因素離群值。

8. 如果存在多因素離群值，首先要確定多因素離群值存在的原因，原因主要有三種：數據錄入錯誤；測量錯誤；真實存在的異常值。

處理方法分為2種：

(1) 保留離群值：

1) 將因變數轉換成其他形式，然而轉換後的結果比較難解釋，如果選擇變換，需要對所有的假設進行重新檢驗；

2) 將離群值納入分析，理想情況下，需要找到一個方法能夠評估離群值對分析結果的影響。可以分別納入多因素離群值和剔除多因素離群值進行分析，並對兩個分析結果進行比較。如果兩者結論一致，則可以保留多因素離群值。

(2) 剔除離群值：

直接刪除離群值很簡單，是常用的辦法。當我們需要刪掉離群值時，應該注意一個離群值可能會掩蓋另一個離群值的存在。所以在刪除離群值後，應重新進行對假設的檢驗。最後需要在結果中報告刪除的離群值和原因。

9. 需要去除之前對數據的拆分。在主菜單下點擊Data > Split File...，如下圖所示：

10. 出現Split File對話框，點擊Analyze all cases，do not create groups,點擊OK。

五、多元方差的SPSS操作

(一) SPSS操作

1. 在主菜單下點擊Analyze >General Linear Model >Multivariate...，如下圖所示：

2. 出現Multivariate對話框，將humanities_score和science_score選入Dependent Variables，將gender和intervention選入Fixed Factor(s)，點擊Post Hoc；

3. 出現Multivariate: Post Hoc Multiple Comparisons for Observed Means對話框，將gender和intervention選入Post Hoc Tests for，在Equal Variances Assumed下方選擇Tukey，點擊Continue；

4. 點擊Options，出現Multivariate: Options對話框，如下圖所示；

5. 將gender和intervention選入Display Means for:下方，並同時選中gender和intervention，將交互項gender*intervention選入Display Means for:下方，勾選Display下方的Descriptive statistics、Estimates of effect size和Homogeneity tests，點擊Continue，點擊Paste。

6. 出現如下圖所示的語法編輯器頁面；

7. 找到第8行語法：/EMMEANS=TABLES(gender*intervention)，並在其後加上空格，加上語法：COMPARE(gender) ADJ(BONFERRONI)，如下圖所示；

注釋：COMPARE()表示主效應的執行命令，COMPARE(gender)表示會輸出gender對因變數的主效應，ADJ(BONFERRONI)是進行主效應間兩兩比較的命令，並對顯著性水平進行Bonferroni校正。

8. 複製/EMMEANS=TABLES(gender*intervention) COMPARE(gender) ADJ(BONFERRONI)，並將其黏貼至下一行，將gender改成intervention，如下圖所示；

9. 在主菜單下點擊RUN> All,如下圖所示。

(二) 檢驗假設8：樣本量足夠

多元方差分析中的樣本量足夠是指自變數的每組中的例數要不少於因變數個數，本例中因變數有2個，所以自變數每組中至少有2例才能滿足樣本量足夠的假設。在輸出的結果的Descriptive Statistics表中可以看到每組10例，滿足條件。

(三) 檢驗假設9：自變數的各組觀察對象之間因變數的方差協方差矩陣相等

在輸出的結果的Boxs Test of Equality of Covariance Matrices表中，如果P<0.001，則違反了協方差矩陣相等的假設；如果P>0.001，則協方差矩陣相等的假設成立。

本例中，P=0.009>0.001, 所以各組觀察對象因變數的方差協方差矩陣相等的假設成立。大家可能注意到此時的顯著性水平是0.001而非0.05，這是由於該檢驗的敏感性所以下調了顯著性水平。

如果檢驗發現方差協方差矩陣不相等，可以不進行處理，但是需要用Pillai』s criterion統計量而非Wilks Lambda，因為Pillais criterion對於不相等的協方差矩陣更穩健。

(四) 檢驗假設10：每個因變數在自變數的各個組中是否方差相等。

在輸出的結果的Levenes Test of Equality of Error Variances表中，該檢驗中如果P<0.05，則方差不相等；如果P>0.05，則方程相等。本例中，P值均大於0.05（分別為P=0.750和P=0.964），所以方差相等的假設成立。

如果檢驗發現方差不等，有2種方法進行處理：（1）對因變數進行轉換，並重新進行所有的檢驗；（2）不進行處理，並接受較高的α水平，即犯I類錯誤的概率可能增大。

六、結果解釋

在結果解釋之前，我們需要先明確幾個概念：單獨效應、主效應和交互作用。

單獨效應（simple effect）：指其他因素的水平固定時，同一因素不同水平間的差別。例如，當A因素固定在第1個水平時，B因素的單獨效應為20；當A因素固定在第2個水平時，B因素的單獨效應為24。

主效應（main effect）：指某一因素的各水平間的平均差別。例如，當A因素固定在第1個水平時，B因素的單獨效應為20；當A因素固定在第2個水平時，B因素的單獨效應為24。平均後得到B因素的主效應（20+24）/2=22。

交互作用（interaction）：當某因素的各個單獨效應隨另一因素變化而變化時，則稱這兩個因素間存在交互作用。

當存在交互作用時，單獨分析主效應的意義不大，需要逐一分析各因素的單獨效應；當不存在交互作用時，說明兩因素的作用效果相互獨立，逐一分析各因素的主效應即可。

1. 多元方差分析的交互作用的結果

(1) 在Multivariate Tests表中，Pillais Trace、Wilks Lambda、 Hotellings Trace和Roys Largest Root為四個多元統計量，用於檢驗組間差異。首先要判斷兩個自變數之間是否存在交互作用，最常用的統計量為Wilks Lambda，該檢驗P<0.05時，自變數之間存在交互作用。

本例中，交互項的F=4.046，P=0.004，Wilks Λ=0.753； partial η2=0.132，所以gender和intervention之間存在交互作用，即干預對學生成績的影響在男女之間存在差異。

(2) 發現交互項對因變數有影響後，我們還需要判斷交互項對哪個因變數有作用。Tests of Between-Subjects Effects表實際上是對因變數單獨進行一元方差分析的結果。P<0.05時，自變數對因變數的影響存在統計學意義；P≥0.05時，自變數對因變數的影響不存在統計學意義。

本例中，我們看交互項對兩個因變數的影響，發現交互項對文科成績的影響有統計學意義（P=0.003）,而對理科成績的影響不存在統計學意義（P=0.056）。

2. 單獨效應（simple main effect）的結果

(1) gender的單獨效應（simple main effect）

在Univariate Tests中輸出了在干預的不同組中，學習成績在男女中是否存在差異。

我們以文科成績為例，如下表所示，可見Regular（P=0.664）和Rote（P=0.086）干預組中男女生文科成績的差異不存在統計學意義，在Reasoning干預組中男女成績的差異具有統計學意義（P=0.002）。

(2) intervention的單獨效應（simple main effect）

相似的，以文科成績為例，未發現在女學生中不同干預方式對文科成績的影響，但在男學生中不同干預方式對文科成績的影響具有統計學意義（P<0.001）。

然而，由於intervention是三分類變數，我們如果想知道到底是那兩個組之間存在差異，就需要進行兩兩比較。下表是兩兩比較的結果。對於每科成績和每種性別，都進行了三種干預方式的兩兩比較：regular與rote，regular與reasoning，reasoning與rote。

下面我們看一下因變數為文科成績時，在男性中，在Mean Difference（I-J）列可以看到regular組與rote組文科成績平均值差值為1.600，但是regular與rote兩種干預方式的比較P=1.000，說明兩者之間的差異不具有統計學意義。

相似的，在男性中，reasoning組與regular組的文科成績平均值差值為9.600，差異具有統計學意義（P<0.001）。

3. 多元方差分析的主效應

(1) Gender的主效應

如下圖突出顯示中，gender對因變數的主效應不具有統計學意義，F=0.900，P=0.413，Wilks Λ=0.967； partial η2=0.033。

(2) Intervention的主效應

如下圖突出顯示中，intervention對因變數的主效應具有統計學意義，F=6.220，P<0.001，Wilks Λ=0.656； partial η2=0.190。

當多元方差分析的主效應對因變數有意義時，需要解讀單因素分析的主效應結果（univariate main effects），這部分結果在Tests of Between-Subjects Effects表中。

如下圖所示，干預方式對文科成績的影響具有統計學意義（P<0.001），而對理科成績的影響不存在統計學意義（P=0.153）。

由於干預方式是三分類變數，我們下面需要看兩兩比較的結果。如下圖所示，可以看到三種干預方式對文科成績影響兩兩比較的結果。

Regular組和rote組的文科成績差異不具有統計學意義（P=0.896），regular組和reasoning組文科成績的差異具有統計學意義（P<0.001），rote組和reasoning組文科成績的差異具有統計學意義（P<0.001）。

七、撰寫結論

1. 當自變數之間存在交互作用時

運用兩因素多元方差分析方法對性別和干預方式對學生學習成績（包括文科成績和理科成績）的影響進行分析。

分析前對方法的假設進行檢驗：散點圖發現自變數的各個組內，因變數間存在線性關係；Pearson相關發現兩因變數之間不存在多重共線性（|r|<0.9）；通過箱式圖未發現單因素離群值，通過馬氏距離未發現多元離群值（P>0.001）；

Shapiro-Wilk檢驗顯示兩因變數（文科成績和理科成績）服從正態分布（P>0.05）； Boxs M檢驗顯示自變數的各個組內兩個因變數的方差協方差矩陣相等（P=0.009）；Levenes檢驗顯示自變數各個組內因變數方差相等（P>0.05）。

性別和干預方式的交互作用對因變數的影響存在統計學意義， F=4.046，P=0.004，Wilks Λ=0.753； partial η2=0.132，即干預對學生成績的影響在男女之間存在差異。

多元方差分析顯示性別和干預方式的交互作用對文科成績的影響有統計學意義（F=6.406, P=0.003；partial η2=0.192），但對理科成績的影響不具有統計學意義（F=3.034, P=0.056；partial η2=0.101）。

單因素主效應分析顯示在男學生中不同干預方式對文科成績的影響具有統計學意義（F=17.283, P<0.001；partial η2=0.390），但在女學生中不同干預方式對文科成績的影響無統計學意義（F=1.785, P=0.178；partial η2=0.062）。

因此，在男學生中對不同干預組的文科成績進行了兩兩比較。成績用均值±標準差表示。男生文科平均成績在常規干預組為61.40±5.23，在死記硬背式干預組中為59.80±5.22，在推理干預組中為71.00±3.33。

常規干預組與推理干預組的文科成績差值為9.60（95%CI:4.51-14.69，P<0.001），具有統計學意義；死記硬背干預組與推理干預組的文科成績差值為11.20（95%CI:6.11-16.29，P<0.001），具有統計學意義；常規干預組與死記硬背干預組的文科成績差值為1.60（95%CI:-3.49-6.69，P=1.000），不具有統計學意義。

2. 當自變數之間不存在交互作用時

運用兩因素多元方差分析方法對性別和干預方式對學生學習成績（包括文科成績和理科成績）的影響進行分析。

分析前對方法的假設進行檢驗：散點圖發現自變數的各個組內因變數間存在線性關係；Pearson相關發現兩因變數之間不存在多重共線性（|r|<0.9）；通過箱式圖未發現單因素離群值，通過馬氏距離未發現多元離群值（P>0.001）；

Shapiro-Wilk檢驗顯示兩因變數（文科成績和理科成績）服從正態分布（P>0.05）； Boxs M檢驗顯示自變數的各個組內兩個因變數的方差協方差矩陣相等（P=0.009）；Levenes 檢驗顯示自變數各個組內因變數方差相等（P>0.05）。

性別和干預方式的交互作用對因變數的影響不存在統計學意義， F=1.026，P=0.264，Wilks Λ=0.953； partial η2=0.022。

多元方差分析顯示干預方式對文科成績的影響具有統計學意義（F=12.661, P<0.001；partial η2=0.319），但對理科成績的影響不具有統計學意義（F=1.944, P=0.153；partial η2=0.067）。

因此，對不同干預組的文科成績進行了兩兩比較。成績用均值±標準差表示。常規干預組的文科平均成績為60.95±1.03，死記硬背式干預組的文科平均成績為61.60±1.03，推理干預組的文科平均成績為67.60±1.03。

常規干預組與推理干預組的文科成績差值為6.65（95%CI:3.14-10.16，P<0.001），具有統計學意義；死記硬背干預組與推理干預組的文科成績差值為6.00（95%CI:2.49-9.51，P<0.001），具有統計學意義；常規干預組與死記硬背干預組的文科成績差值為0.65（95%CI:-2.82-4.16，P=0.896），不具有統計學意義。

（想要及時獲得更多內容可關注「醫咖會」微信公眾號：傳播研究進展，探討臨床研究設計與醫學統計學方法；如果你想使用文中數據進行練習，請隨時給小咖（微信：xys2016ykf）發消息，小咖將原始數據發給你。）