『多因子』情景分層因子初探

作者:范寒 原文鏈接:情景分層因子初探

一.前言

傳統多因子模型忽視了個股之間的基本面情況差異和選股因子在不同風格股票池裡的適用性,因此產生了能夠捕捉不同股票之間差異性的動態情景模型(Dynamic Contextual Alpha Model)

我們知道,不同個股的基本面屬性可能存在非常大的區別,所以傳統的基本面研究以行業或者市值作為劃分標準的依據。人們嘗試尋找在行業內有顯著效果的因子對行業內的股票進行獨立打分,然後再匯總個股的得分或者排序,從而得到全市場的排序。這一方法提高了Alpha模型的廣度(Breadth),但也存在幾個問題。比如,行業的分類主要依據是主營業務,所以公司的基本面並不一致;隨著公司的成長,基本面也在發生著變化;行業內的股票有限,容易造成過擬合。

動態情景Alpha模型摒棄了行業內打分的做法,轉而根據股票基本面的屬性,比如估值,成長和盈利能力等,把股票分成不同的層面,對每個層面內的股票採用單獨的評價體系進行打分或者排序,最後得到每個股票的綜合得分。這種方法能有效的捕捉市場的風格切換,提升因子模型的適應能力。

二.因子分類

既然要對因子進行分層,首先就要將因子進行分類,比如從風格維度上來說,因子可以分為規模,價值,成長,盈利,流動性水平等。

優礦的DataAPI裡面提供了因子的數據和分類,為了方便今後使用因子,不妨按照優礦的分類將因子整合一下

先將DataAPI.MktStockFactorsOneDayGet的詳情描述複製粘貼存為excel,再把這個excel上傳到研究環境的data里

這樣或許還不是很方便查找自己想要的因子,不妨寫個函數,輸入中文即可查找相關因子,滿足像ctrl+F的功能

可以試一下原文中這個函數

這樣就可以按照自己的想法方便地查找需要的因子了

三.情景分層因子的構建

模型構建的基礎是找到用什麼因子對股票進行分層,從而把握市場的風格。分層的目標是把具有相似的基本面的股票聚集在一起,同時不同的分層又能夠刻畫股票基本面上不同的屬性。分層的理性結果是不同的Alpha因子在不同的分層(如大市值和小市值,高估值和低估值)有著顯著的績效差別。

鑒於以上目標和平時研究因子性質的需要,我把整個過程寫成了如下的類,處理的問題就是看一段時間內因子在所指定因子分層下的表現。

具體的講,就是:

1.指定一個分層因子和其它被觀察的因子,以及研究的時間範圍,數據頻率(如周度,月度等),股票範圍

2.在每個規定的時間點上,首先把想要研究的全部股票按照分層因子的值等分成兩塊(high,low),每一塊的股票數量相同,如大市值股票和小市值股票

3.計算其它因子在不同股票池上的風險調整後的Rank IC ,和IC_IR

4.利用統計檢驗分析因子IC在不同分層下的顯著性差異

這裡的風險調整IC計算公式為:IC_{adj} =corr(f_{pure} ,r_{residual} ),其中f_{pure} 是上期因子值中性化後的值,r_{residual} 是當期個股收益中性化後的結果,回歸的方程表示為:

r為當期個股收益,f為上期因子原始值,X為行業虛變數,log(mktcap)為市值的對數

在優礦上,可以用函數neutralize來代替回歸這一步

IC_IR就是IC值得均值除以方差

這裡的統計檢驗,我使用了三個,一個是針對均值的t檢驗,一個是針對方差的檢驗levene檢驗,和對分布的K-S檢驗

先解釋一下上述結果,首先表格第一行給出了本次檢驗的基本信息,分層因子,時間範圍,數據頻率和股票範圍

第二,三行是對下面數據的說明,比如mean表示均值,而high和low則分別表示分層因子值高的股票組合和分層因子值低的股票組合。

t檢驗的原假設是兩個樣本的均值相同,所以p值越低,說明兩樣本差異越大

levene檢驗的原假設是兩個樣本的方差相同,p值越低,說明兩樣本差異越大

k-s檢驗的原假設是兩樣本分布相同,p值越低,說明兩樣本差異越大

按照我們的經驗,市值因子對市場風格的捕捉能力很強,09年起,小盤股在A股市場一騎絕塵,時而伴隨著巨幅的大小盤風格切換。

我們首先來看看估值類因子在市值分層下的結果

近三年,從中證全指的檢驗結果來看,估值類因子中,就Rank IC的均值t檢驗而言,PB和PS因子在大小盤分層下具有顯著的績效差別。對於小盤股,可以關注ASSI

再來看看盈利能力和收益質量類因子在市值分層下的表現

從盈利能力和收益質量類因子來看,具有明顯區分度的是OperatingExpenseRate,OperatingProfitRatio、OperatingProfitToTOR這三個因子,都是和營業利潤相關的,並且在小盤股的表現明顯優於大盤股。對於小盤股,估值時可多關注凈資產和營業利潤。

最後看一下,盈利能力和收益質量類因子在PB分層下的表現

在PB分層下,似乎盈利能力和收益質量類因子因子的表現沒有太大的差異。這可能不是一個好的情景分層因子

總結

關於情景分層因子的選擇,Barra有相關的論文,感興趣的礦友不妨去看看文獻China_Equity_Model_CNE5

選出了情景分層因子之後如何使用,希望有機會在今後一起探討。

希望本帖提供的工具對各位有用,下面是上述函數的說明圖。

其他相關文章:

Quartz 1.x - 因子分析模板

基於因子IC的多因子模型

國海證券《因子預測能力初探》uqer實現(一)

國海證券《因子預測能力初探》uqer實現(二)


推薦閱讀:

既然巴菲特的投資組合是公開的,為什麼大家不直接照搬呢?
[譯]量化投資教程:投資組合優化與R實踐
現代投資組合理論的發展
耶魯模式成功在何處?
在資金管理方面你都有哪些有價值的經驗?

TAG:量化 | 多因子模型 | 投资组合 |