SPSS分析數據時,兩組連續變數數據的pearson相關不顯著而spearman相關顯著,以哪個為準?

用SPSS分析實驗數據時,兩組連續變數數據的pearson相關不顯著而spearman相關顯著,以哪個為準?兩種方法有什麼區別嗎?謝謝!


兩種方法的主要區別:

(1)含義和特點不同:皮爾遜相關係數被廣泛用來度量兩個變數之間的線性相關性強弱。其主要特點:1)使用Pearson線性相關係數必須假設數據是成對地從正態分布中取得的,並且數據至少在邏輯範疇內必須是等間距的數據。2)不論是樣本的還是總體的Pearson相關係數絕對值均小於等於1,相關係數等於1或-1時。3)所有數據的點都精確地落在一條直線上。4)Pearson相關係數不隨著變數的位置或是大小的變化而變化。

Spearman等級相關是用非參數方法比較兩變數之間的相關問題。如果正態分布和等間距這兩個條件不符合,一種可能就是採用Spearman秩相關係數來代替Pearson線性相關係數。秩相關(rank correlation)又稱等級相關,它是一種分析變數與變數等級間是否相關的方法。適用於某些不能準確地測量指標值而只能以嚴重程度、名次先後、反應大小等定出的等級資料,也適用於某些不呈正態分布或難於判斷分布的資料。

(2)計算公式不同:Pearson相關係數是用原來的數值計算積差相關係數,而Spearman相關係數是用原來數值的秩次計算積差相關係數。即,pearson相關係數(兩個變數間的皮爾遜積矩相關係數)被定義為這兩個變數的協方差與二者標準差積的商(公式略 ),而Spearman等級相關係數的計算方法:r=1-frac{6Sigma d_{i}^{2} }{n(n^{2}-1) } ,其中,d_{i}為原變數X_{i} Y_{i} 排列後其數據所在位置的差。

(3)不管變數之間的關係是否是線性的,只要它們具有嚴格的單調函數關係,變數間的Spearman秩相關係數就是1,相同情況下的Pearson相關性在變數不是線性函數關係時,不是完全相關的。

(4)在樣本數據呈橢圓形分布且無明顯的外形輪廓時,Spearman秩相關係數和Pearson線性相關係數大小比較接近;當樣本有尾部或具有明顯的外形輪廓時,Spearman秩相關係數沒有Pearson線性相關係數敏感,這時二者之間存在著差異。

當兩個相關係數之間存在差異時,究竟以哪個數為準,需要依據樣本數據的特徵來選擇:

(1)連續數據,正態分布,線性關係,用pearson相關係數是最恰當,當然用spearman相關係數也可以,但效率沒有pearson相關係數高。

(2)上述任一條件不滿足,就用spearman相關係數,不能用pearson相關係數。

(3)兩個定序測量數據之間也用spearman相關係數,不能用pearson相關係數。


Pearson 相關和 Spearman 相關的主要差別可以從兩個方面來看。

  1. 從數據類型上來看,Pearson correlation 主要是用來測試 interval 變數,而Spearman correlation 主要是用來測試ordinal 變數。interval變數測量的是絕對差距,而這種絕對差距是有意義的。比如 100攝氏度和50攝氏度的差別,與50度和0度的差別是一樣的。 ordinal 變數主要測量的是相對差距的order,而不是絕對差距。比如大多數主觀量表的測量值。

  2. 從測量的相關關係上區分,Pearson correlation 主要是用來測試線性關係(linear relationship),而Spearman correlation 主要是用來測試單調關係 (monotonic relationship)。線性關係比較好理解,單調關係是指(1)當x變數增加時,y變數也增加;或者(2)當x變數增加時,y變數降低。從這點上來說,線性關係要比單調關係嚴格。

Spearman 相關是Pearson 相關 的nonparametric 版本。所以你可以通過數據類型來判斷,具體使用哪種方法。當Pearson 相關的假設不滿足時,我們可以使用Spearman 相關。另外,根據你得到的結果也可以說明,這兩個變數的關係是單調關係,而非線性關係。


推薦閱讀:

因變數是分類變數 自變數有連續變數也有分類變數 用SPSS的什麼方法做分析?
SPSS 怎樣才算學到家了?
使用了大量數組公式導致Excel卡死,有沒有解決方法?
參加數學建模美賽,做icm需要有些什麼準備?
文科生如何自學spss。有哪些入門書籍適合菜鳥學習?

TAG:SPSS | SPSS數據分析 | 計量經濟學 |