關於多因子模型的「IC信息係數」那些事
(這篇文章首發於微信公眾號「量化投資訓練營」,為數庫科技與該機構聯合出品)
有過多因子模型開發經歷的人,或者初學多因子模型的愛好者應該了解到,股票多因子模型從邏輯和演算法角度來看並沒有很複雜,關鍵在於因子的挖掘與權重的確定。
同時,多因子模型的構建是相對標準化的,具體包括:單因子分析,因子選擇,多因子模型構建,模型選股。其中涉及一些參數的設置,包括:股票池的選擇,因子加權方法,股票加權方法,分組組數,調倉期和回測時間等。顯然,這些流程和參數都是易於模塊化實現的。
我們在上個月和數庫的工程師接觸後發現,這些內容都可以由他們提供的多因子模型回測平台很好的實現,來實現無需編程、可視化的研究。要知道對於很多市場感覺很強的研究人員來說,並非很快能夠熟練掌握編程工具,此時有這類工具協助開發模型如有神助(量化投資策略平台 - Chinascope數庫)。
既然是這樣,我們提出請求,是否可以請他們做一些公益性的科普文章,對方答應下來,於是就有了孫晶晶研究員撰寫的這篇小文——關於多因子模型的「IC信息係數」那些事。
1、信息係數是什麼?概念很重要!
信息係數(Information Coefficient,簡稱 IC),表示所選股票的因子值與股票下期收益率的截面相關係數,通過 IC 值可以判斷因子值對下期收益率的預測能力。
大多數情況下,如何簡單通過IC值判斷因子重要性呢?
通常 IC 大於3%或者小於-3%,則認為因子比較有效。常見的 IC 有兩種,一是 Normal IC(類比皮爾森相關係數概念),另一個是 Rank IC(類比斯皮爾曼相關係數),如下圖所示。
所以說信息係數越大,該因子越有效,這就是最簡明的答案。1.1、Normal IC
Normal IC,即某時點某因子在全部股票的暴露值與其下期回報的截面相關係數;
1.2、Rank IC
RankIC,即某時點某因子在全部股票暴露值排名與其下期回報排名的截面相關係數。
2、IC 衰退是怎麼回事?如何發現觀察這個情況?
因子有效性是具有時效性的,IC 作為度量因子有效性的主要指標,其穩定性值得關注。因子 IC 衰退,是通過觀察隨著滯後時間的延長,因子有效性降低的速度。研究發現,很多因子具有相對穩定的半衰期,即因子有效性降低為一半所需要的時間,因而可以通過觀察半衰期的長短判斷該因子的穩定情況。
與上文提到的 IC 指標計算方法類似,IC 衰退的計算,只不過數據用的是所有股票當期的因子暴露值與滯後 i 期的收益率數據。
首先,計算每期的因子暴露值和滯後 i 期的收益率間的 IC 信息係數,其中 i=1,2,...,12;
其次,分別對因子每隔 i 期的信息係數計算均值;
下圖所示為總市值對數因子的 IC 序列及 IC 衰退情況,由於市值因子是升序排列(即市值越小越好),因而 IC 為負值,由圖可見其 IC 水平高,且衰退較慢,因而該因子具有可持續性。
總市值對數因子IC衰退3、IR信息比率有什麼意義?
信息比率(IR),即超額收益的均值與標準差之比,則 IR 的基本公式如下。
3.1、多因子中 IR 的計算
在多因子模型中,計算信息比率的公式如下,即年化超額收益與跟蹤誤差的比值。
3.2、IR 的推導公式1
IR 還可以根據 IC 近似計算,公式如下。該公式是從超額收益出發,逐步推導得出的。
3.3、關於 IR 的定律2
Grinold(1989)提出的 fundamental law of active management,公式如下所示。
結合 3.2 和 3.3 可得出如下前提3:
4、小結
關於 IC 和 IR 的表述和計算公式較多,上文做了簡要的梳理。鑒於 IC 的重要性,在多因子的因子加權中常採用因子最近 N 個月(默認為 12)的 IC 均值進行加權,通常結果會優於等權法。
IC 作為多因子分析的重要指標,但實際使用仍需結合其他相應指標如收益率相關指標等,可結合數庫 Factors 量化分析平台(http://factors.chinascope.com)中 IC 分析和收益率分析進行研究。
-------------------------------------------------------------------
1 Active risk and information ratio (Edward Qian, Ronald Hua, 2004)
2 The fundamental law of active management (Grinold,1989).
3 該前提在實際中較難滿足。
關於作者
孫晶晶, 數庫量化分析員數庫量化投資平台網址:量化投資策略平台 - Chinascope數庫
聯繫我們
郵件:business@chinascope.com電話:021-3635 9360-511小編微信號:chinascopeservice數庫(上海)科技有限公司是一家基於機器學習演算法的大數據量化分析公司。通過數庫獨家的挖掘以及分析工具,可以使非結構化、半結構化的數據結構化;使原本無序沒有關聯的數據產生關聯性,進而實現數據智能化,為個人投資、金融機構投研提供精準而又全面的技術服務。
成立於2009年,先後在2011年和2015年獲得穆迪以及京東金融的投資。並在2016年被KPMG評選為中國科技金融50強企業。
推薦閱讀:
※『多因子』多因子模型水平測試題(強答下 )
※【信號】神策alpha No.2
※『多因子』MultiFactors Alpha Model - 基於因子IC的多因子合成
※大家聊聊使用JoinQuant是什麼體驗?
※量化策略系列教程:15KDJ策略