如何理解結構方程模型?


結構方程模型(SEM, Structural Equation Modeling)是建立在回歸模型(Regression Models)的基礎上,針對潛變數(Latent Variables)的統計方法。

f為latent variable, 例如智力、自尊等,在該SEM模型中為predictor。y1,y2,y3為observed variables, 即可直接測量得到的變數,在該SEM模型中為indicators。λ1-3為factor loadings,ε為residual error。

先前提到SEM是建立在regression model基礎上的,該模型可寫為如下方程:

y1 = λ1*f + ε1

y2 = λ2*f + ε2

y3 = λ3*f + ε3

即可看到與regression model的聯繫。

SEM較為廣泛應用的是方差/協方差估計法。即可由上述方程寫出關於y1,y2,y3的方差/協方差矩陣:(σ為f的variance)

而後計算機根據實際矩陣,對factor loadings等parameters進行估計並輸出估計矩陣,與實際矩陣差異最小(最理想)時,即輸出結果,得到各估計參數和擬合指數。

應用較多的模型/方法:MIMIC, multiple group models(比較組間差異), latent growth modeling(比較縱向差異)等。

應用廣泛的軟體:

1、Mplus。優點:編程簡單,結果全面。缺點:收費,貴。學生版是300$。

2、Amos。優點:傻瓜,畫圖拖數據即可。缺點:模型稍一複雜就很費時。

3、R。下個package即可。優點:兼容性、專業性強。缺點:用的人少,不利於伸手黨。

4、LISREL。優點:易入門。缺點:需輸入各矩陣,略過時。

其他還有一些軟體,不了解。

SEM入門不久,以上為個人理解,求探討求輕噴。么么噠


結構方程模型的初衷在於針對潛變數之間關係進行建模。例如,智商,情商,成功這三個潛變數之間到底是何種關係?但是它們三個本身不可直接測量,於是需要通過一定手段對它們進行測量。你當然可以先通過量表各自「估計」這三個潛變數,再建立三者間的模型。結構方程模型實現了這兩步的一體化,優勢在於,估計的過程中充分考慮了潛變數間的關係。而分開兩步是不能做到的。當然這是否真的是優勢有待商榷。

結構方程模型的估計方法主要有三類:第一種是協方差分析法,第二種是偏最小二乘法,第三種是貝葉斯法。

協方差分析認為,潛變數間的關係反映在可測變數的協方差關係中,由模型產生的協方差結構和真實協方差結構應一致(理想情況)。於是以協方差矩陣的差異作為優化準則。偏最小二乘的想法為:考慮潛變數結構的前提下,「最好」的潛變數應該與對應可測變數「最接近」。於是,其優化準則本質是OLS。貝葉斯也是對潛變數假定先驗,然後用MCMC直接對潛變數進行抽樣,既然潛變數的樣本都有了,結構方程模型也就退化為了一堆回歸。

國內很多文獻把結構方程模型等同於上述第一種估計方法,這是一種誤區。每一種方法都有各自的檢驗和評價手段。三種方法孰優孰劣?難以確定,只能說,各有各的優勢和不足。另外,結構方程模型定位是驗證性分析,這需要大量背景知識支撐,否則建模必然失敗。近年來,發展了探索性的結構方程模型,題主不妨找找cnki。

希望對題主有所幫助。


SEM具體的分析步驟就不詳細說了,隨便拿到一本有關的書都會有詳細的介紹,這裡主要講一下題主所說的如何理解SEM

對於SEM的理解其實很簡單

當我們面對一個難以描述概念時,就需要找到符合該概念下的指標。比如健康這個概念,我們很難描述,就會用心率、血壓、體溫等等指標來反映這個概念。當我們有了一定的研究後,從理論上已經分析出了多個難以描述的指標之間的關係,需要從實證角度來證明,就需要用到SEM。

原理上的理解:

在書上看到過這樣一句話:

"結構方程模型是因子分析和路徑分析這兩種古典的統計模型互相結合、浴火重生的產物」

因子分析引入了潛變數的思想,路徑分析則實現了在模型中可同時引入多個因變數。

即有了眾多答案中所提到的測量模型、結構模型。


不帶中介的SEM實際上就是先做因子分析,然後再做回歸分析,這裡就不說了。

說說帶中介的SEM,假設自變數是X,因變數是Y,中介變數是M

實際上Y關於X的模型有兩個:

模型1:Y = W*X + B

模型2:Y = W1*M + B1

M = W2*X + B2

即Y = W1*(W2*X + B2) + B1 = W1*W2*X + W1*B2 + B1

令:W = W1*W2

B = W1*B2 + B1

可以得出W1 = W / W2 = (B-B1)/B2

最終:W = (W2/B2)*B - (W2/B2)*B1

發現沒,通過中介變數,最終W和B映射上了,本來W和B可以認為是獨立的。

對於沒有量綱的問卷數據來說,係數是可以比較的。

所以你可以把中介變數理解為神經網路中的某種激活函數,通過這個激活函數,實現X和Y的某種更強的映射或者連接,X和Y的關係可能更強了(有中介效應)或更弱了(沒中介效應)。


有沒有大神幫忙解釋一下因子分析法和結構方程模型在模型驗證方面有什麼異同?


回歸+因子分析


推薦閱讀:

大偏差技術是什麼?
周志華老師解釋集成學習時用到hoeffding不等式解釋誤差上限【機器學習,172頁】?
如何評價2016年我國勞動力總量下降349萬?
互信息(Mutual Information)多大才算大?
為什麼多因子模型不做時間序列的股價預測?

TAG:統計 | SPSS數據分析 | 心理統計 | 結構方程模型StructuralEquationModeling |