用EXCEL畫交互效應圖
6 人贊了文章
最近偶然看到Coursera上的一門課程叫:Understanding Your Data: Analytical Tools。
這門課包含中介模型、調節模型、多層分析等,講課人是弗吉尼亞大學的老師Cristiano Guarana,配有訓練數據集、PPT、參考文獻、輔助畫圖工具等可供下載,可以說是非常好的入門課程,如果大家有興趣可以去學習,課程鏈接如下。
https://www.coursera.org/learn/uva-darden-understanding-data-tools/home/welcome在該課程第一周末尾,講到了調節模型,並說到了如何用EXCEL繪製交互效應圖。今天就向大家介紹一下畫交互效應圖的方法。
我們有3個變數,分別是Meaningfulness, Organizational Identification, Task Performance。現在我們想知道Meaningfulness和Task Perfomance的關係是否受到Organizational Identification的調節,也就說說Meaningfulness和Task Perfomance的關係是否隨著Organizational Identification水平的變化而變化。
我們採用Hayes的Process來驗證該調節模型,選用model 1,將Mean, Perf, OrgID分別放入自變數X,因變數Y,調節變數M中。
然後在Options中勾選:
Mean center for products 交互項中心化
Print model coefficient covariance matrix 生成協方差矩陣
運行之後得到如下結果,關鍵部分我已經添加註釋(#)
Run MATRIX procedure:************* PROCESS Procedure for SPSS Release 2.16.3 ****************** Written by Andrew F. Hayes, Ph.D. www.afhayes.com**************************************************************************Model = 1 # 模型號,調節模型為模型1 Y = DV_Perf # 因變數Task Performance X = IV_Mean # 自變數Meaningfulness M = W1_OrgID # 調節變數Organizational IdentificationSample size # 樣本量 1000**************************************************************************Outcome: DV_Perf # 以Task Performance為結果變數Model Summary R R-sq MSE F df1 df2 p .1565 .0245 1.0004 8.3318 3.0000 996.0000 .0000Model # 係數 標準誤 t值 p值 左區間 右區間 coeff se t p LLCI ULCIconstant 1.4729 .0338 43.5778 .0000 1.4065 1.5392W1_OrgID .0984 .0302 3.2610 .0011 .0392 .1576IV_Mean .0328 .0346 .9480 .3434 -.0351 .1006int_1 .0603 .0234 2.5805 .0100 .0144 .1062# 可以看到交互項的p值為0.0100,顯著Covariance matrix of regression parameter estimates # 協方差矩陣 constant W1_OrgID IV_Mean int_1constant .0011 .0000 .0000 -.0003W1_OrgID .0000 .0009 -.0004 .0000IV_Mean .0000 -.0004 .0012 .0000int_1 -.0003 .0000 .0000 .0005Product terms key: # 交互項的定義,Meaningfulness x Organizational Identification int_1 IV_Mean X W1_OrgIDR-square increase due to interaction(s): R2-chng F df1 df2 pint_1 .0065 6.6588 1.0000 996.0000 .0100*************************************************************************Conditional effect of X on Y at values of the moderator(s): W1_OrgID Effect se t p LLCI ULCI -1.1629 -.0374 .0444 -.8408 .4007 -.1246 .0498 .0000 .0328 .0346 .9480 .3434 -.0351 .1006 1.1629 .1029 .0435 2.3664 .0182 .0176 .1882# 在調節變數的均值,上下一個標準差時,X對Y的效應。可以看到只有在高水平的Organizational Identification下,X對Y的影響是顯著的Values for quantitative moderators are the mean and plus/minus one SD from mean.Values for dichotomous moderators are the two values of the moderator.**************************************************************************Data for visualizing conditional effect of X on YPaste text below into a SPSS syntax window and execute to produce plot.DATA LIST FREE/IV_Mean W1_OrgID DV_Perf.BEGIN DATA. -1.0157 -1.1629 1.3964 .0000 -1.1629 1.3584 1.0157 -1.1629 1.3205 -1.0157 .0000 1.4396 .0000 .0000 1.4729 1.0157 .0000 1.5061 -1.0157 1.1629 1.4828 .0000 1.1629 1.5873 1.0157 1.1629 1.6918END DATA.GRAPH/SCATTERPLOT=IV_Mean WITH DV_Perf BY W1_OrgID.******************** ANALYSIS NOTES AND WARNINGS *************************Level of confidence for all confidence intervals in output: 95.00 # 置信水平NOTE: The following variables were mean centered prior to analysis: IV_Mean W1_OrgID # 已經中心化的變數------ END MATRIX -----
從結果中得知交互效應顯著,但如何用更直觀的圖形給讀者解釋這個調節效應呢?
這時要用到一個EXCEL表,下載可以直接點擊下方的2-wayunstandardised_with_simple_slopes.xls,這份表格來自網站,這個網頁有很多關於繪製交互作用圖的資料,網站鏈接如下:
Interpreting interaction effects找到2-way_unstandardised_with_simple_slopes.xls
打開之後,界面如下:
需要輸入的信息大致分為4類:
- Variable names 變數名稱
- Unstandardised Regression Coefficients 非標準化回歸係數
- Means / SDs of variables 變數的均值、標準差
- SIMPLE SLOPES ANALYSIS 斜率分析
下面我們逐步填寫這4類信息:
1.變數名稱
這一步很簡單,填上自變數和調節變數的名稱即可,本例中自變數為Meaningfulness,調節變數為Organizational Identification。
2. Unstandardised Regression Coefficients 非標準化回歸係數
這個之前在PROCESS中已經計算過,coeff即為非標準化係數。
Model # 係數 標準誤 t值 p值 左區間 右區間 coeff se t p LLCI ULCIconstant 1.4729 .0338 43.5778 .0000 1.4065 1.5392W1_OrgID .0984 .0302 3.2610 .0011 .0392 .1576IV_Mean .0328 .0346 .9480 .3434 -.0351 .1006int_1 .0603 .0234 2.5805 .0100 .0144 .1062
自變數IV_Mean,調節變數W1_OrgID,交互項int_1的非標準化係數分別為0.0328,0.0984,0.0603,分別填入即可。
下方還需要填寫截距,在這裡截距即為常量(constant)的係數。
3.Means / SDs of variables 變數的均值、標準差
由於需要提供自變數和調節變數的均值和標準差,這需要在SPSS的分析→描述統計→描述,中得出。
點擊確定,得到如下結果
由於中心化之後,均值為0,自變數和調節變數的均值處只需要填寫0即可。標準差根據剛剛在SPSS中計算的數據分別填入。
4.SIMPLE SLOPES ANALYSIS 斜率分析
在斜率分析這一列中,我們需要填寫自變數的方差,交互項的方差,以及自變數和交互項的協方差。
這時候之前讓大家在運行PROCESS模型的時候勾選的「Print model coefficient covariance matrix 生成協方差矩陣」就派上用場了。在結果中我們看到常量、調節變數、自變數、交互項的協方差矩陣。那麼EXCEL表中要填寫方差,協方差和方差的關係是什麼呢?
Covariance matrix of regression parameter estimates # 協方差矩陣 constant W1_OrgID IV_Mean int_1constant .0011 .0000 .0000 -.0003W1_OrgID .0000 .0009 -.0004 .0000IV_Mean .0000 -.0004 .0012 .0000int_1 -.0003 .0000 .0000 .0005
協方差(Covariance)在概率論和統計學中用于衡量兩個變數的總體誤差。而方差是協方差的一種特殊情況,即當兩個變數是相同的情況。
根據以上定義,我們了解到如果兩個變數相同,協方差就是方差。
所以協方差矩陣中的對角線就是方差。自變數IVMean的方差為0.0012,交互項int_1的方差為0.0005。自變數和交互項的協方差為0.0000。
以上4類信息都填寫完成,最後還有3項信息要填,
第一項是在調節變數的什麼水平下評估斜率,我們填寫調節變數的標準差SD即可;
第二項樣本量,根據你的數據情況填寫;
第三項控制變數的數量,本例中無控制變數,所以數量為0。
至此,所有信息填寫完成,圖便生成啦!
推薦閱讀:
※如何利用歷史銷售數據評估新產品潛力?
※雨沐田:數據分析之Excel數據導入方法
※Ch10 聚類 (思維導圖) 171129
※用特徵選擇方法優化模型|python數據挖掘思考筆記(1)
※有禮有面有據 - 當紀錄片遇到數據可視化