金融研究,數據挖掘與星球大戰

許多發表在金融學頂級期刊的研究揚言:市場存在各種各樣的異象(anomaly)。利用這些因子配置資產能獲得超額收益,回歸出來星星管夠。不過,張櫓等三位學者5月9日貼出的工作論文用1967-2014年的數據,複製了447個此類因子的研究,發現有286個複製不出來。如果使用嚴格一些的標準,還能在5%水平上顯著的就只剩67個了。

流動性(trading friction))因子是重災區,即使按比較寬鬆的標準,102個中,能複製出來的也只有7個。無形資產(intangible)部分,103個中只有26個能複製出來。剩下的四類是動量(momentum)、價值成長(value-versus-growth)、投資(investment)、營利性(profitability),分別包含57、68、38、79個數量的因子,能複製出來的分別有37、31、27、33個,複製成功率分別是65%、46%、71%、42%。

此外,即使是那些仍然保持顯著的因子,在複製研究中能達到的超額收益水平也明顯降低。引入q因子模型之後,還能保持5%水平以上顯著的就只剩下46個了。t值能夠保持大於3的因子只剩下11個。說實話,搞到這個程度,個人感覺Novy-Marx(2014)找出來的那幾個變數說不定更有助於資產管理:抬頭看看行星的軌跡,再聞一聞曼哈頓街區的空氣。太陽上的黑子牽動你我的命運,總統的黨派,才是金融市場最大的歧異。

導致這種問題的原因是什麼?第一個可能的因素就是為了星星而挖掘數據(p-hacking、cherry-picking、kitchen sink,等等)。頂級期刊不接受不顯著的結果,所以遇到星星不夠多的回歸,就直接扔掉;或者跑很多很多組回歸,然後挑一組最完美無瑕的。第二個因素是金融學期刊一般不發表複製研究,學者沒有激勵去監督。第三個因素是用的數據太單調,全是美國數據。如果一個東西真是規律,那就應該用各國數據都跑一下。

這一問題可能不止於市場異象這一塊。原文三位作者提到的這幾個問題,在經濟學和金融學中都存在。在這些默默領域耕耘的研究生和本科生,可能有許多都經歷過文章結果複製不出來的困惑。不過,儘管這些努力可能並不討好,還是有學者一直在嘗試複製或檢驗。三位作者列舉了近二十年來這方面的許多努力。總之,純粹的數據挖掘,已經不是經濟學了,解釋應該要有理論支撐。另外一個啟示就是:市場看起來還是蠻有效的。

參考文獻:Novy-Marx R. Predicting anomaly performance with politics, the weather, global warming, sunspots, and the stars[J]. Journal of Financial Economics, 2014, 112(2): 137-146.

Hou, Kewei, Xue, Chen, Zhang, Lu. Replicating anomalies[J]. 下載地址摸這裡。

推薦閱讀:

如何評價羅振宇在2017跨年晚會推薦的書《樞紐》?羅胖據此得出結論:中國成為這一輪全球產業轉移的終點?
生活中的那些免費經濟學,你知道多少?
過去30年,美國資本市場全靠這頭「大慢牛」
是否有一些國家「越發展,越貧窮」?原因是什麼?
如果中國爆發大規模經濟危機會對世界經濟造成怎樣的影響?

TAG:金融学 | 经济学 | 复制 |