SPSS做相關分析,通過了顯著性檢驗,但相關係數低,怎麼解釋?
顯著性水平sig=0.000,即:在P=0.01的水平顯著,顯著性非常高,表示相關性很強。但相關係數又只有0.299,表示兩變數基本不相關。如何解釋?
完全不矛盾。顯著性回答的問題是他們之間是否有關係;相關係數回答的問題是相關程度強弱。更直接一點我們可以回到公式,相關顯著性檢驗的t統計量可以表示成
可以看出對於任意值的r,只要數量n足夠的多就能使統計量足夠的大,通過顯著性檢驗的可能性就會更高。樓主的樣本量是1003,這種情況在樣本量比較大的情況下會更常見。
先舉個栗子。
我兜里有一塊錢,這個時候有個人來搜我身=。=他發現我有錢誒,所以跟大家說:「我確定一定以及肯定,這個傢伙兜里有錢!「他說得對_(:3 」∠)_,我兜里確實有錢。然後我從兜里掏出了那僅有的一塊錢。。。。
雖然他說我有錢,我也確實有,但不代表我有很多嘛。( ° △ °|||)。同理,sig值很高說明A、B確實存在關係,它確定以及肯定二者存在某種微妙的關係。
但具體這關係有多微妙,相關性有多高,就不一定了╮( ̄▽ ̄)╭所以相關係數有0.299也就在情理之中了。我有錢,但我真的沒很多錢呀。&<(? ?*)&>
然後課本上學到的0.3確實只屬於弱相關,不清楚樓上的答主為什麼說已經挺高的了0.0。是在實踐中很難得到高相關係數的數據嘛?另,做推斷統計之前,描述統計真的不能少_(:3 」∠)_
也不知道我說的對不對啊.. 如果說的不對歡迎一起探討學習_(:3 」∠)_顯著性水平sig=0.000,那是說明他們存在顯著性差異,只能說明他們是有關係的,不是說相關性強,相關係數為0.299,不是說他們不相關,而是說他們弱相關,是具有相關性的,只是關係非常弱。這兩個數據並沒有什麼矛盾,在數據樣本足夠的的時候,經常可以得出這樣的結論。pearson相關係數的正確性需要得到散點圖的證實,你應該檢查一下散點圖,看看數據是否具有線性趨勢,特別是有沒有離群值或極端值扭曲你的相關係數,散點圖這個步驟很容易被忽略,但對相關分析而言十分關鍵!
皮爾遜係數表示的是線性相關性係數,這個數據說明兩者相關,但是線性相關度不高,也就是說存在其他的非線性關係,他們的關係不是一元而是多元。
顯著性只看sig,而且0.299已經挺高的了
我也遇到了同樣的問題,百思不得其姐啊。。
重要性檢驗只能證明假設成立,只能證明有一定的相關性,但是弱相關,不能通過簡單的回歸建模,要通過其他方式進行模型構建。
其實相關中最重要的就是p值或者說顯著性,它和r值的大小也就是圖中的皮爾遜係數(person)是無關的。
只要p值小於0.05,拒絕原假設,那麼r值就是具有統計學意義的,就能說明二者是相關的。注意,相關分析其實也就只能說明這些了。
如果想要進一步的知道兩個變數之間相關了多少、相關係數的具體值,那就需要進行回歸分析了。
所以相關分析一般用於篩選變數,做做初期而已,真正重要的還是在回歸分析當中。
並不矛盾,當你樣本容量很小的時候有時候會出現相關係數比較大,顯著性檢驗卻沒有通過的情況,當顯著性檢驗沒有通過的時候,即使相關係數再高也只能看作是由偶然因素引起的。反之,你樣本容量較大的時候,除非變數之間有極強的關聯性,否則相關係數都不會特別大。
有大神知道這些數據是不是用這個分析的嗎?還有不同字母差異顯著性怎麼看
親,這個顯著性檢驗怎麼做
很清晰的回答 多謝
推薦閱讀:
※假設有一個「真」隨機序列,那如果把這個序列記錄下來重新放一遍,請問還是「真」隨機么?
※1000桶水,其中兩桶有毒,豬喝毒水後會在15分鐘內死去,想用一個小時找到這桶毒水,至少需要幾隻豬?
※Statisticians和Data Scientist到底是怎麼聯繫在一起的?
※如何在 R 中高效快捷地處理大量數據?
※截至 2014 年 7 月初,魅族 MX3 的銷量有多少?