實驗主義的計量經濟學 | 《基本有用的計量經濟學》導讀
來自專欄 計量模型與這個世界
一直以來,我對計量的認識是「描述歷史」的語言,屬於描述性研究的範疇。一個式子通常有清晰的角度、嚴謹地表達,信息量也通常比圖文高效,因此計量經濟學在描述性研究當中有自身獨特的優勢。所有描述性研究可能存在的缺點,計量經濟學都很難避免。因此,我對計量經濟學的各種缺陷的態度是十分寬容的。
不過,一部分計量學者試圖把計量經濟學從「描述分析」搞成「因果分析」,越來越多的實驗主義教材變得流行,這總是好事。因此,我讀了教材《基本有用的計量經濟學》,本期內容為原書第二章的讀書筆記。教材對中國的計量教育無疑是有功勞的,給人啟發,但也,遠不是金科玉律。(我想原書作者趙先生應該不會反對。例如第24頁「潛在結果的三個基本條件….」句子里,潛在結果四個字怕就是筆誤。)實驗主義的觀點和基本方法論,在學者中的影響越來越廣泛,也伴隨著巨大的爭議。對實驗主義的批判,足以寫另一篇長文。不喜歡的工具,不用就好,不喜勿噴。
從一個經濟學例子開始。
分稅制是眾多經濟問題的重要原因,無論是昨天的土地財政還是明天的房產稅,都跟分稅制有複雜且顯然的某種因果關係。但是,如果細緻地考察裡面的因果關係,分稅制並不會必然導致房產稅,沒有分稅制未必就不會發生土地財政。分稅制確實作為一個原因存在,但是這個原因既不充分,也不必要。這讓我產生疑惑,經濟中的因果關係,究竟是什麼?
經濟生活當中存在大量的數據指標。實驗主義試圖在紛繁的數據當中發現較為嚴格的因果關係。他們關心因果關係,研究政策評價,聲稱可以篤定地解釋「某個行為帶來了什麼樣的後果」,」某個後果是基於什麼樣的原因「,並預言這樣的因果發現對未來的經濟管理決策有指導和啟發的意義。如果說A是B的原因,是不是說沒有A就不會有B呢?令學者困擾的是,我們並沒有觀測到沒有A的情形,因此我們所說的因果關係並不會理直氣壯。
因果推斷有一個基本問題,那就是,我們無法同時觀測到個體的所有潛在結果的現象。我們並不知道,如果分稅制制度沒有發生,後續的地方財政會是什麼樣的狀態。觀測值是我們知道的全部,因為沒有對比實驗,我們得到的因果關係可能不可靠。既然如此,觀測值並不能為我們識別因果帶來幫助,實驗主義決定,放棄對觀測值的依賴,只研究潛在結果。
實驗主義認為,如果對i 個體做干預,我們會觀測到潛在結果 ,如果不干預,相應地觀測到潛在結果 。我們只能觀測到其中一個,但我們可以用統計學的方法來估計另一個。也就是說,我們不計較最終觀測到了什麼 ,我們更在意潛在結果集合{ , },在意介入干預這件事,對比不介入,究竟對應什麼樣的潛在結果集合{ , }.
潛在結果裡面通常不涉及概率。如果泛泛而談,我們可以說在名校讀書可以提高獲得高薪工作的概率。但具體到某一個同學,比如張三,如果他在去了名校讀書,我們可以在他畢業若干年內觀測到他有沒有獲得高薪工作;如果他沒去名校讀書,我們也可以在他畢業若干年內觀測到他有沒有取得高薪工作這件事。儘管兩個結果的取得,都有一定的偶然因素;但對張三來說,結果是有還是沒有,是百分百的事情。
經過了對潛在結果的定義,因果性研究變得容易。我們可以篤定地說,因為A所以B了。下面對因果關係做簡要的梳理。
在嚴格的「相關係數」被定義之後,人們普遍接受,相關性不是因果性。知乎有一位高中二年級的用戶,對因果關係做了詳細的總結:【綜述長文】因果關係是什麼?結構因果模型入門
我在這裡選幾個節選,並略摻私貨作為補充:
傳統計量因果基本上討論的是相關關係。
不相關事件定義為A.
A若成立則B 幾不會發生—>若B發生則推斷A不成立。
【沒有直接討論B發生時A成立的概率,這個概率通常不容易求,這是一個重要的缺點,招致大量的批評:對P值的批評|Enough,就這幾個理由顛來倒去】
樸素的反事實因果:有A則有B,無A則無B
格蘭傑因果:如果觀測到A在前面發生,那麼接下來觀測到B的概率將較高。
貝葉斯因果:通常也是基於觀測值。條件概率較無條件概率有變化,則有因果關係。
實驗主義的因果定義:因為A發生而不是沒發生, 結果導致了事件 (兩個結果相減)
這確實是我們希望研究的一種因果關係。面對選擇要不要做A的時候,這樣的因果關係可以幫助我們預見到,做了會怎麼樣,不做會怎樣,以此幫助我們決策。我們甚至不關心觀測到什麼,那是另一回事。潛在結果的比較之差本身,就是干預帶來的結果。背後的科學思想,大概有對照實驗_百度百科作為基礎。
這兩個結果,有一個最終發生了,並被觀測到;另一個沒有發生,所以需要我們去估計。估計這種「反事實的結果」,就是實驗主義研究當中的重要工作。
下面是一個斷點回歸的例子:
黃埔軍校為中國的近現代歷史培養了大量的軍事將領,然而,黃埔軍校所提供的教育,是不是士官卓越軍事才能的原因呢?
這裡有一個問題,我們只能觀測到,那些這些讀過黃埔軍校的人所表現出來的才能 ;但我們沒辦法觀測到,如果這些人沒有考上(對照實驗/或者叫控制實驗),同一個人在社會上磨練到相同的年齡,會表現出怎麼樣的軍事才能 。第二種潛在結果並沒有發生,需要特別估計。為什麼有人被分配到被黃埔軍校影響,有人被分配到不受影響?既然觀測到的都是優秀的人,沒被觀測到的都是不夠優秀的人,這裡的分配原則是不夠隨機的。觀測值不能直接拿來估計潛在結果。
倘若有足夠多的數據,哪些人考上了(與上學的人擁有相似的初始才能)但是沒去上學。這些人可以幫助我們估計 不幸的是,但這類數據通常太少。
我們還有另一個辦法,去尋找那些差一點考上的人和剛剛好考上的人,考慮到微弱的差距充滿了隨機性,不妨把兩類人當成具有相似的初始才能,然後用差一點就能考上的人,去估計那些剛剛好能考上的人的 . 這裡有一點需要補充,沒考上的人所表現出來的才幹,並不能被拿來估計那些取得高分而錄取的那些將領的 .大家的初始才能是不同的。
上面的例子當中,我們找了一個斷點,然後在斷點附近設計了實驗。為了更好地描述因果效應,下面定義幾個因果效應參數:
平均因果效應:
例:一個軍官上黃埔軍校帶來的影響
干預組的平均因果效應:
僅計算受過干預的樣本(他們的 是猜出來的),得到
例:那些上黃埔軍校的人,上黃埔軍校帶給他們的影響。
控制組的平均因果效應:
僅計算未受干預的樣本(他們的 是猜出來的),得到
例:那些沒上黃埔軍校的人,如果當初上黃埔軍校,將會帶給他們什麼影響。
實證研究的內容,就是對上述參數的估計。
如果一個對象,被分配到干預組或者控制組(或稱對照組)的這種分配是具有一定隨機性的,這種分配如果沒有選擇偏差,則可以用回歸方法得到相關因果效應參數的估計。
例如,如果無論是否干預,所有樣本的潛在 是相同的,那麼可以用控制組的觀測結果替代干預組的 ,回歸分析的結果等價於對干預組的平均因果效應的考察。反過來同樣成立,如果無論是否干預,所有樣本的潛在 是相同的,那麼可以用干預組的觀測結果替代對照組的 ,回歸分析的結果等價於對控制組組的平均因果效應的考察。
導讀到此結束,實驗主義的研究觀念大抵如此,但有豐富的細節,並不是一篇導讀能概況的。
不知道這樣的因果研究,各位讀者滿意么?
推薦閱讀:
※歸納法,演繹法,科學。
※大科學工程項目,如何減振是個問題
※土豪大牌 Life Technologies 過往的輝煌
※訓練集雜訊對於深度學習的影響
※為了研究怎麼吃不胖,科學家竟對他們做出這樣的事...