相關性與因果有什麼聯繫與區別?
最近看書還有知乎都頻繁提到相關性與因果這兩個我認為極其相似的名詞,但是很明顯在大家眼裡都是不一樣的。小弟特在此誠心誠意的問一下!如果不願意打字給推薦一本靠譜的書也好。謝謝!
記得諾獎得主 Chris Sims 經常舉的一個例子:
雞叫天就亮了 --- 這是相關性但天亮不是因為雞叫 --- 沒有因果性蘋果價格升高 公交車票價格也會升高 兩者價格相關 但是不存在因果 不能說公交價格提高導致了蘋果價格提高 原因可能是因為通貨膨脹……
個人見解,歡迎交流。
先從計量經濟學的角度談談:相關性主要是指變數之間的一種相互關聯,相互協同。
1.方向:可能是榮辱與共的正向關係,也可能是此消彼長的負向關係;
2.程度:可能是相關關係密切,也可能相關性很弱。最簡單的一元線性回歸里,y和x之間的相關係數就度量了二者之間相關性的強弱程度。因果關係就是字面意思所表示的那樣——一種變數的變化完全造成了另一種變數的變化,而不是其他變數的作用與影響。這是最簡單的一對一的因果關係,也是計量中最常見最重要的。當然一對多,多對一,多對多在這兒不討論(這主要是哲學範疇里的探討)。
因果推斷,最初是為了模仿自然科學的做法,想得到兩個變數之間確切的因果關係。舉個例子,在物理中,我們都知道牛頓定律F=ma. 實驗時,竭盡全力在真空環境中打造一個無比光滑的水平面,放上質量為m的小滑車,然後精確的給它一個大小為F的力,觀察並測度小滑車的變化,最後我們得出結論,在小滑車靜止時,前前後後只有力F的作用,那麼小滑車接下來的變化必定是力F的作用所致。同樣的,計量經濟學也想得到自然科學實驗這種近乎精確的結果。於是就有了隨機控制實驗的思想,通過反事實分析,企圖達到自然科學的精確程度,從而使經濟學看起來更為「科學」。為了進行隨機控制實驗(田野實驗,有情境的田野實驗等等),包括自然實驗,自然的自然實驗等等,計量中產生了很多方法模型,主要有PSM,斷點回歸,二重、三重差分等等。實際上這些方法,從數學的角度來看,是在概率上符合因果推斷的。此處不再展開講了,內容太繁雜。一般來說,因果關係是包含在相關關係里的,但相關性就不一定是因果關係。例子前面的很多回答都有了。
然後我從哲學角度也談談我的認識:
從普遍聯繫的觀點看,這個宇宙上任何二者之間都是因果關聯的,從而沒有所謂的相關關係。譬如說某顆小行星此刻正以某種變化的速度離我們越來越遠,而這個結果,你我都是貢獻了一份力量的,這個貢獻是我們和這顆行星之間的萬有引力,或者是其他更微觀尺度的作用力,亦或者是其他的聯繫。總之,沒有我們,這顆行星不會有此時此刻的狀態,或許會遠離我們的速度快了微毫,或許方向有0.000……01°的偏差,如此等等。這樣看來,因果關係是必然的,只是關聯強度的不同。如果宇宙是個封閉的時空系統,那麼它就是一個內部決定演變體系。
此是其一。第二點想探討的是自然科學的實驗是否能完全控制其他所有因素。答案顯然是否定的,那麼對於自然科學的結論,我們也可以持否定態度。自然科學中也有很多bug,譬如測不準原理,數學中的羅素悖論,薛定諤的量子疊加態(貓),所以對於波普的證偽主義我也一直持否定態度。不過就目前實際的科研工作來說,我們還是姑且認為都是對的吧。
手機打字好累,就扯這麼多。我看題主標了個「計量經濟學」的標籤,我猜是想問計量分析中因果性與相關性的問題。
在絕大部分的計量線性分析中(因才疏學淺,目前接觸到的模型)只能得到相關性,得不到因果性,只能說被解釋變數和解釋變數存在線性關係。
但是被解釋變數一定是解釋變數的結果嗎?不一定。
如果得到兩個變數之間的因果性呢? 主要是靠經濟學的故事和邏輯,輔以一些計量上的高級模型和方法得到。其實從認知哲學層面來說,並沒有什麼【因果】,【因果】都是【假設】,因為【因果】是用【歸納法】得到的,也即:觀察枚舉。但是你不能觀察所有時間、空間發生的事件。因此:
- 有限的枚舉判斷不能下全稱判斷。
如:觀察到N次【a事件】以後接著發生【b事件】,不代表所有的【a事件】以後會接著發生【b事件】
- 實際如此,不代表必定如此。也即:實然不等於應然。
如:觀察到N次【a事件】以後接著發生【b事件】,不代表所有的【a事件】必定會導致【b事件】的發生。
所謂的【可證偽性】就可以從中推導出來,因為歸納判斷都是一種可能性,沒有邏輯上的普遍性和必然性。
所以,康德認為【因果認識】屬於我們人類大腦中【預裝的操作系統軟體】,仔細講的話很複雜。
【因果性】一定有兩個【必要條件】:
1、無反例。
2、兩個事件在時間上前後相繼性。
在理想條件下:a發生以後,接著發生b,而且做過很多次實驗,沒有發現反例。
注意:是【必要條件】,不是【充分條件】。
符合這兩個條件,不一定是【因果關係】,但沒有這兩個條件一定不是【因果關係】。
我們為什麼要尋找【兩件事相關】?
就是為了尋找【因果關係】,以實現控制、預言。
也就是說:
我們首先發現兩件事有相關性,然後再進一步剔除、增加一些變數,驗證其因果性。
所以,因果一定相關,相關不一定因果。
首先要確定兩個事件有相關性,然後再判斷兩個事件有無因果關係,比較苛刻條件下的相關性關係就可以視為因果關係。
--------------------------------------------------------------------------------------------------
另外判斷因果關係,要從深層次上解釋兩件事件的發生作用機制。
比如:手裡拿一個蘋果,如果我鬆手的話,就掉到地上,時間上有前後相繼,也不會有反例,但是,這還不夠,我必須要解釋:「為什麼我鬆手蘋果就是落地」。
牛頓的解釋是「萬有引力」,愛因斯坦的解釋是:質量導致空間彎曲,而蘋果會沿著彎曲空間的測地線走,所以,蘋果必定會落地。
因果性判斷,不同學科苛刻程度是不一樣的,
比如:物理學只要一個與預言不符合的【反例】就可以推翻【因果關係】或【全稱判斷】。而醫學很難理想化條件,因為世界上沒有兩個人的體質完全相同的,苛刻程度就要低一點。嚴格來說,經濟學、社會學中根本就沒有因果關係。
--------------------------------------------------------------------------
到底有沒有因果關係,因果是客觀還是主觀的,在哲學上還有爭議。也即著名的休謨難題,康德的解釋只是其中一種。
如果確實有因果關係,而且普遍、必然,那人有自由意志可言嗎?因為人是物質構成的。
自由意志會不會是一種假象?如果有自由意志,那為什麼人的大腦中的思維可以不服從因果律?(哲學問題就不多談了)
簡單但明了的因果關係是存在的。比如,前天吃了壞東西,今天肚子疼。(排除其他可能)。但是,對因果關係的理解深淺,不在於對哲學對方法論對邏輯的理解程度。在於對醫學對常識(上例中)的理解程度。又但是,複雜的因果關係一般很難被確定地確定。後果就是,很多人成功不知道怎麼成功的,失敗不知道為什麼失敗,稀里糊塗過一生。還有人分不清那條因果線,把某個果歸在一堆其實不相關的因里。當你能夠準確的理解大多數果的因的時候,你就可以很容易的推測因的果是什麼,從而調整因達到果。
街上行人打傘和下雨有相關性,但是下雨不一定非要打傘,打傘也不會導致下雨,所以打傘和下雨無因果關係
我一直覺得相關性包含因果性。
相關關係變數間地位相同,因果關係變數分因變數和自變數,不可以互換,且因果關係有時間發生的先後。
推薦閱讀:
※為什麼線性回歸中 要將自變數設定為非隨機變數?伍德里奇的導論好像是設為非隨機變數的 本人學渣求解釋?
※計量時間序列經過協整後得出誤差修正模型,還需要做異方差檢驗嗎?
※對於初學計量經濟學得人來說有必要學習eviews嗎?
※如何通俗地解釋多重比較謬誤(Familywise error rate)?