論經濟分析中的數學檢驗到底有沒有實際意義?

現在的經濟學(慢慢推廣到其他人文社科)研究當中流行這樣的研究思路:

第一、提出假設;第二、尋找數據並進行計量回歸;第三、進行數學檢驗。假如檢驗通過,就認為假設是成立的。

這種研究方法是當前國際上最流行的研究方法,也是最權威的研究方法。在目前這個時代,假如不按這種方法進行的研究,寫出的論文,大致是無法在最頂級的權威期刊上發表的。

但是筆者認為,對於社會問題(包括經濟問題)進行計量回歸中的數學檢驗是偽檢驗,不具備真實意義。也就是說:這種檢驗是無效的。而計量回歸的分析方法,在預測能力方面也是比較弱的。

一個非常明顯的例子是在去年美國大選的時候,美國的學者們幾乎一致認為:希拉里會獲勝。因為他們使用了最先進的計量模型對此進行預測,幾乎所有的預測都認為希拉里會贏。但是結果卻是特朗普大勝。

為了解釋為什麼最先進的計量模型預測美國大選的不成功,山東大學陳強教授專門寫了一篇文章《民調為何無法預測川普勝選美國總統》對此進行分析。陳強教授指出,存在如下原因決定了預測結果是不準確的:隨機樣本、無應答偏差、應答偏差、變化的總體等等。總結起來其實就是一個原因:數據本身存在問題。

因此,我們可以看到,陳強教授分析說明:計量分析無法逾越數據缺陷。雖然美國是計量方法的鼻祖,美國的計量研究水平也遠超過中國,中國在這方面差距美國可能還有相當大的距離。但是,對於存在缺陷的數據,再先進的計量方法也無能為力。除了數據的缺陷之後,數據搜集方法的缺陷,模型的設定,同樣是造成預測不準確的重要原因。數據為什麼會存在問題,因為採集方法有問題。為什麼採集方法有問題,因為時代在變化,方法跟不上時代了。

清華大學李子奈教授對此也早有分析,他將計量經濟學模型的樣本數據質量概括為一致性、完整性、準確性和可比性四個方面。(《計量經濟學模型對數據的依賴性》)假如不能滿足這樣四個方面的要求,所做來的計量結論就是可疑的。

但是最大的問題其實不在這裡,而在於:所有的計量分析都存在這樣一個步驟:檢驗。能夠發表出來的計量論文,也統統是通過了所要求的各種檢驗的。所以現在有一種說法:寫論文就是數星星,星星越多,分析就越可靠。然而,現實卻是:星星再多,數學檢驗的通過,也並不代表在真實世界中同樣通過。那些預測希拉里大選獲勝的論文,哪篇不是數學檢驗通過的?但是現實結果就是希拉里大敗。這說明什麼?說明經濟計量論文的檢驗,在數學上也許是有效的,但是對於真實世界無效。

其實陳強教授作為計量經濟學的專家,自己也寫過類似的文章。例如,陳強教授於2014年10月《經濟學(季刊)》發表了一篇文章:《氣候衝擊、王朝周期與游牧民族的征服》。這篇文章試圖用計量經濟學的方法證明兩個核心觀點:第一、中國歷史上游牧民族對中原地區的征服是受氣候衝擊所致,而且主要是受降水量的影響,旱災容易促使游牧民族南下。第二、游牧民族的南下還會受王朝周期的影響,假如游牧民族南下的時候,中原的王朝比較年輕,就能夠抵禦衝擊。假如王朝的歷史已經比較長久了,就容易被征服。

《經濟學(季刊)》是中國最好的經濟學期刊之一,陳強教授也是中國頂級的計量經濟學教授,他對於計量經濟學研究方法的掌握是相當高超的,所以他的研究可以被認為具有一定的代表性。

為了證明自己的觀點,陳強教授舉出歷史上的7個例子:「中原王朝共被征服了7次(約佔樣本的15%),即316年西晉被前趙(匈奴)征服,589年南朝陳被隋征服,後唐與後晉分別於936年與947年被遼(契丹)征服,1127年北宋被金(女真)征服,1279年南宋被元(蒙古)征服,以及1644年明朝被滿清征服。」

但是從史實分析,這7個例子,無一符合他的假設。(詳見拙文《游牧民族對中原地區的征服是受氣候衝擊所致嗎?》)也就是說,陳強的例子,恰恰背離了其結論。

問題在於:陳強教授的分析,同樣的通過了數學檢驗的,所以能夠得以在頂級期刊上發表。但是,他的檢驗,在史實站不住腳。可見,數學檢驗無法檢驗數據的真實有效性。假如數據本身存在某種問題,這種數學檢驗是無效的。

這更能證明數學檢驗的結果與真實世界無關。因此,對於社會問題而言,數學檢驗是無效的。真實社會問題的檢驗只能通過真實世界來檢驗,而不能用數學檢驗來檢驗。

從哲學上說,數學是對真實世界的模擬,但是並非真實世界。自然現象變化相對比較小,加上可以進行反覆的試驗,所以用數學模擬非常成功。但是對於人類社會現象而言,則變數極多,而且反覆試驗比對。另外,數學是對自然世界的模擬,而非心理世界。100個+100人,肯定等於200個,多一個少一個都肯定不正確。但是工作效率涉及到人心,變化極大。100人+100人的工作效率,可能是200人,也可能是1000人,但也可以等於零。另外,當代主流的體系化的經濟是模仿經典物理學建立起來的,講究內存邏輯的一致性。例如,經濟學假設,當一個人在進行消費的時候,如果選擇A優於選擇B,選擇B優於選擇C,則選擇A一定優於選擇C。但是這樣的假設在心理實驗中通不過。因此,模型可以幫助我們思考,但是對其進行精確的數學計量是做不到的,甚至不能對現實社會進行定性分析,所以對其進行複雜的計量回歸併進行數學檢驗也是無效的。

所以,張五常認為:「你看那些統計分析、回歸分析,不知所云,廢物一堆。」,「經濟理論需要回歸實證」,「我反對的理由,是現在的經濟學無從驗證。所謂的驗證不是真的驗證,完全沒有解釋能力。」(張五常《從科學角度看經濟學的災難》講座。2017年5月20日。)

假如張五常可以被認為只是一個主流經濟學的邊緣人物,他的判斷可以不被重視的話,我們再看看西方主流經濟學泰山北斗式人物弗里德曼的判斷。弗里德曼認為:「作為一種語言,理論不具有任何實質性內容,而僅是一系列套套邏輯(同義反覆的詞語的綜合體)。」(弗里德曼:《實證經濟學的方法論》。)也就是說:理論本身,包括計量經濟學的模型本身,都不具備真實含義。那麼,紙面上的數學檢驗,更不過是套套邏輯(同義反覆的詞語的綜合體),在數學上有意義,對於檢驗現實則無意義,一個理論的正確與否,有用與否,只能通過現實檢驗。就比如說陳強教授的大作《氣候衝擊、王朝周期與游牧民族的征服》,其數學檢驗只能檢驗陳強教授本身所進行的數學推導過程是否有誤,但是不能檢驗出其論點是否符合歷史事實。很明顯,陳教授的判斷是完全不符合歷史事實的。因此,他的論證是不能成立的。

國際投資大亨也多不認同現在流行計量經濟方法及其數學檢驗。

著名投資家巴菲特與諾貝爾經濟學獎的獲得者法瑪就出現過爭論。2013年尤金-法瑪因為對資產定價領域的相關貢獻,與彼得-漢森和羅伯特-希勒一起獲得了諾貝爾經濟學獎。法瑪的主要理論是「有效市場假說」,即市場總是有效的。有效市場假說的一個最主要的推論就是,任何戰勝市場的企圖都是徒勞的,因為股票的價格已經充分反映了所有可能的信息,包括所有公開的公共信息和未公開的私人信息,在股票價格對信息的迅速反應下,不可能存在任何高出正常收益的機會。對此,著名投資家巴菲特表示不認同,他認為:「如果市場總是有效的,我只能沿街乞討」。索羅斯同樣不能認為市場完美的假設。索羅斯曾經說過這樣一句話:「有效市場假說已經破產。」

李子奈也評價說:「……計量經濟學模型的預測功能曾經被誇大了。應該看到,……對於非穩定發展的經濟過程,對於缺乏規範行為理論的經濟活動,計量經濟學模型顯得無能為力。」事實上,大部分經濟活動都是非常穩定發展的。甚至可以這樣認為,從稍長時段觀察,幾乎不存在穩定發展的經濟。因此,對於較長時間的宏觀經濟預測而言,計量回歸只具有參考的意義,各種數學檢驗都沒有真實意義。

北大國發院教授陳平基於系統論的研究也認為:「開放經濟中的社會演化和制度變遷是像生物演化一樣的分岔過程,不是交易成本和產權學派所描述的封閉系統中的收斂過程。」(《新古典經濟學在轉型實驗中的局限性》。)因為開放經濟的過程是不收斂的,因此,當前在社會科學領域所流行的計量回歸分析很少是有效的,其數學檢驗也是靠不住的。

李子奈還總結說:「盧卡斯(R.E.Lucas,1976)指出使用計量經濟模型預測未來經濟政策的變化所產生的效用是不可信的,提出了結構模型參數是否隨時間變化的問題。薩金特(T.J.Sargent,1976)以貨幣政策為例,重新解析了Lucas批判,認為結構模型對於評價未來政策似乎是無能為力的。」

還是讓我們回到弗里德曼,他總結說:「作為一個實質上的假說體系,理論應當通過對其意在加以「解釋」的那類現象的推測力來加以判斷。只有事實證據可以表明它是「正確的」還是「錯誤的」,是可以被暫時「接受」為有效的,還是應被「拒絕」的。正如我下文將要著力論述的,對某一假說的有效性的唯一合意的檢驗,就是把它的推測與經驗相對照。如果其推測與經驗相矛盾(「頻繁地」,或者說比某個替代性假說更為經常地與經驗相矛盾),那麼這個假說就被拒絕;如果不發生矛盾,那它就被接受;如果經過多次檢驗都沒有發現矛盾,那麼假說就得到了更大的可信度。」(弗里德曼:《實證經濟學的方法論》。)

因此,本文認為,雖然不是全部,但是對人類社會現象進行數學檢驗大致是一種偽科學,或者是一種類科學,因為經不起真實生活的比對。

雖然如此,筆者依然認為計量是一種很好的研究方法,至少可以成為其他方法的重要對照。只是在當前的研究中,滿足於把通過數學檢驗當作假設是否成立的標準,嚴重偏離現實,結果非常糟糕。可以明確的說:考慮到人類社會的複雜性,模型通過數學檢驗不能代表假設成立,模型不能通過數學檢驗也不能代表假設不能成立。模型是否成立的唯一標準是現實檢驗,而非數學檢驗。用僅僅通過數學檢驗的經濟分析及預測模型來指導經濟實踐,是非常危險的。

有兩種調查方式,一種是學術界流行的方式,即進行比較大樣本的調查,但是對每個樣本本身的理解是膚淺的,對於樣本內部的結構關係也是模糊的。例如美國大選前的民意調查。現在流行的發放調查問卷,其實也是這種性質。也就是按自己的思路,及事先設定的框架來過濾信息。

另一種是毛澤東當年提倡的方式,即解剖麻雀式的調查方式。特點是樣本數比較少,但是對單個樣本本身了解得比較深入,對樣本之間的關係也比較清晰。

當然,現在學術界流行的調查方式因為樣本數比較大,而且,數據也是按照事先設定的格式來搜集的,所以便於進行數據處理。但是可能存在系統性的偏差,或者所調查對象的真實信息沒有得到真實的反映。因此,所進行的分析及檢驗當然也是無效的。毛澤東式的調查,樣本數較少,不便於進行數據分析,可能也不便於充分反映全部的情況,但是至少對於調查本身的理解是比較深入與準確的。至少,這種方式可以接觸到調研對象真實的人性人心情感,而這些是大問卷調查中感覺不到的。

一定要進行比較的話,可以認為兩者都存在缺陷,但是在對於真實信息的了解方面,毛澤東式的調查方式更有效。但是,這種方式在學術界被看作是落後的。

筆者曾在北大清華等多所高校學習,旁聽過多位著名經濟學家的講課,發現有這樣一個特點:當這些經濟學家在進行數學分析的時候,自信滿滿,底下學生們也忙於抄筆記,少有人能夠當場提出問題。而是這些經濟學家對社會現象進行分析的時候,則往往出現諸多漏洞,底下學生常常能夠與之爭論不休,經濟學家們自己也常常被這些疑問搞得很尷尬。道理很簡單,社會現象各有自己的觀察與思考,經濟學家的分析一旦不符合社會現實,學生馬上就能發現。但是數學分析不是能夠迅速理解並且發現漏洞的,即使發現了明顯的漏洞,也可以解釋為有意忽略。中國古人在評價商紂王為什麼會亡國的時候,有一個評價,說他「智足以拒諫」,也就是智慧足以拒絕不同意見。當代的經濟學家們的數學分析,也具有排斥不同意見的作用。當然,客觀地說,這種排斥是不完全的,但是通過數學分析模式的確立,不同意見之間的爭論就在相當大程度上被限制在數學分析的內部,對社會進行的分析就在相當大程度上被隔離了。這其實會導致經濟學的分析變成一種內部循環,脫離實際。

最後總結:筆者認為:

第一、計量模型大致只能反應自然世界的邏輯,不能充分有效反映心理世界的邏輯。而人類社會的活動是充滿了心理影響的,所以計量模型不可能準確反映真實世界的情況。

第二、在社會科學領域,系統複雜,影響因素眾多,且存在結構性問題。如李子奈教授就強調要進行準確的計量分析,數據必須滿足一致性、完整性、準確性和可比性四個方面的要求,陳平教授認為必須滿足穩定收斂的要求。而這些要求是難以同時滿足的,所以大量的計量回歸模型得出的結論大多不可能真實有效,只能是自欺欺人。

第三、即使計量分析滿足上述條件,數學檢驗的通過與否,也與其是否符合現實無關。因此,社會科學領域的計量分析方法自身無法證實自己的假設。唯一的檢驗標準,只能是現實。

因此,在社會科學領域,計量分析方法是一種重要而有益的研究方法(筆者將近20年前就學習過,只是發現其存在種種問題,所以沒有深入而已),但是其進行各種數學檢驗只有數學意義,不具備現實意義。所以,把計量分析當作最好的學術研究方法,甚至當作是唯一有效的研究方法,則是極其錯誤的。事實上,從數學的哲學基礎和心理學的角度進行分析,可以判斷計量分析甚至是有效性比較弱的一種分析方法,因為它相對遠離人心。人心才是社會一切活動的基礎,離人心越遠的人文社會分析方法,離真實性越遠,預測性也會越差。


推薦閱讀:

山東那個啥子魯易購靠譜么?
如何看待資本主義?
如何評價李嘉誠?
美兩大核彈襲來 全球經濟在劫難逃?(圖)
【張林磊】帶你了解影響黃金消息面的名詞和數據

TAG:數學 | 經濟 | 意義 | 沒有 | 經濟分析 | 實際 | 分析 |