『多因子』多因子模型水平測試題(強答中)
既然作者(@Garden )稱答的不好,那就不曝光了。 作者:匿名。
19. 如何判斷現有因子是否足夠解釋收益率?
判斷解釋能力,最直觀的標準當然是R^2;但是R^2的缺點在於沒有考慮因子的數量,因此可以使用Adjusted R^2,也可以使用RSME。當然對於Alpha模型來說,更重要的是預測能力,可以通過factor return的t值和IC來判斷。
20. 中國股票市場多因子模型的R^2通常在什麼量級?
BARRA CNE5 Model的R^2在0.4左右
21. 為了提高R^2,儘可能多地加入各種因子,會導致什麼問題?
加入更多的因子一定會提升R^2,但是會導致過擬合的問題
22. 如果一個因子與現有因子組均低相關,而且能夠顯著提高R^2,那麼什麼樣的理由可能會使我們選擇不加入這個因子?
因子收益率不穩定,即在統計上因子收益率均值不顯著。
23. 對於回歸法因子測試,能否直接用不同截面的數據疊加在一起進行回歸(即面板回歸)?可能產生的後果是什麼?
不能。因為市場可能會產生結構性調整,牛市和熊市中因子收益率會產生巨大變化。
24. 進行多元回歸時,如何檢驗共線性、異方差問題?如何解決?
用VIF來判斷是否存在多重共線性;異方差和自相關可以用white-robust或者Newey-West-robust解決
25. 無風險資產在各個市場應該如何選擇?中國市場有哪些選擇?各自的利弊(例如歷史長度、數據完整性、代表性等)?
無風險資產是指具有確定的收益率,並且不存在違約風險的資產。在中國,可以用中國固定利率國債作為無風險資產。
26. 計算beta值的基準(benchmark)如何選擇?不同選擇對整個模型影響有哪些方面?
根據投資目標和投資股票池來選擇。
27. 似乎研究者已經慣於用線性模型來解釋收益率,為什麼不用更複雜的模型?(或者已經存在什麼非線性的結果?)
線性模型的可解釋性較好
28. 擬合多因子模型時,數據挖掘問題有多嚴重?怎樣降低過擬合的程度?
選取不同大類的因子、因子構建需要有經濟學邏輯、控制因子的數量等等
29. 在多因子回歸中,預測的目標是什麼?收益率?對行業的超額收益率?對市場的超額收益率?還是其他的?
對市場的超額收益率。
30. 用於收益預測的多因子模型,在擬合時應側重考慮哪些方面?
等各位大牛指點。
31. 因子收益率如何預測?有哪些方法?是否有必要進行因子擇時? 國外的文獻對這方面的研究成果如何?
同上...
32. 構建選股模型時,通常會對許多因子進行降維、合併,這樣做的主要意義是什麼?
同上上。。。
33. 對將要合併的幾個因子,如何分配它們的權重?請對靜態、動態賦值各一例,它們各自的優劣是什麼?
靜態的分配權重方式邏輯簡單、計算方便,缺點在於很難捕捉風格的迅速切換;動態配權的好處在於可以更多地利用市場信息,一般來說好的動態配權方式會提高策略的IR和Sharpe ratio,缺點在於可能會降低絕對收益率。
34. 已知過去若干期的(合併後)因子暴露度,根據以上測試結果,如何預測下期收益率?
不同因子暴露度*因子收益率求和,就可以得到下期收益率預測的打分。
35. 用IC(橫截面相關性)衡量預測有效性有什麼缺陷?
用Pearson Correlation Coefficient計算IC,更容易受極端值的影響,可採用Rank IC(Spearman Correlation Coefficient),同時單期的IC值是用橫截面數據計算得到的,需要綜合考慮IC時間序列上的表現是否穩定。
36. 未來1日收益率預測的IC通常在什麼水平?未來1月的呢?不同時間尺度之間是否有固定的轉換關係?
沒有固定的轉換關係。未來1日IC的水平通常在0.04~0.07之間,未來1月(20個交易日)通常會在0.04~0.1之間。
37. 預測時間尺度如何選擇?未來1天、1周、1月、3月還是更長?【看你擁有的信息/因子在哪個時間尺度上最有效】
需要考慮因子的時間衰減情況,如果因子衰減隨時間衰減較快,需要考慮較短的預測周期
38. 如何將多因子模型的預測與其它預測(例如定性研究對少數股票的預測)整合?
可以在多因子模型選股的基礎上進行權重的微調,量化也並不排斥人工的干預,畢竟無論哪種主動投資的方式的核心都是預測能力;當然也可以在組合優化的構成中加入其它預測的信息,比如BL模型等等。
39. 用於風險預測的多因子模型,在擬合時應側重考慮哪些方面?
等各位大牛指點。
40. 是否有必要預測收益的波動率?如何預測收益的波動率?是否要在優化中使用波動率?
有必要;一般來說,現在都是根據結構化風險模型來預測收益的波動率;在優化過程中當然要使用波動率,因為對於收益波動率的預測至少和對於收益本身的預測一樣重要。
41. 多因子模型預測出的協方差矩陣是否會有發生高度接近奇異的情況?
有可能,可以在因子協方差矩陣對角線元素上加一個較小的正值解決這一問題。
42. 設我們稱風險預測模型中的因子為「風險因子」,稱收益預測模型中的因子為「alpha因子」。如果一個alpha因子也入選了風險因子,會對組合優化結果產生什麼影響?如果在風險模型中特意剔除所有alpha因子,會對組合優化結果產生什麼影響?
如果該alpha因子也入選了風險因子,可能會中性掉該alpha因子的選股能力
43. BARRA的多因子風險預測模型主要在哪些細節上做了精細處理?
BARRA作為業內最頂級的風險模型提供商之一,自然在構建結構化風險模型是對很多細節進行了精細處理,包括但不限於:在估計因子協方差矩陣時的Eigen Factor Adjustment、Volatility Regime Adjustment以及Bayesian Shrinkage等等。
44. BARRA在不同市場上的多因子風險預測模型之間的細微差異,反映了各個市場的哪些特點?
不同市場上多因子風險模型的差異主要有:各個風險描述符構建因子及其權重的不同、factor return的不同等等。表明了各個市場風險來源、市場風格的差別。
45. 用日數據vs用月數據估計協方差矩陣,各適用於什麼需求?用日內(例如分鐘級)數據來估計協方差陣的好處與壞處是什麼?
適用於不同持倉周期的策略。用日內數據來估計協方差矩陣的好處在於可以用於估計的樣本數據長度增加,壞處在於數據雜訊較大。
46. 怎樣衡量或評估風險預測模型的有效性?
一般來說用偏差檢驗(Bias Test)來評測風險模型對於組合波動率的預測精度;從概念上來講,偏差檢驗值代表的是組合實際波動率與預測波動率的比值。
47. 用於業績歸因的多因子模型,在擬合時應側重考慮哪些方面?
等各位大牛指點。
48. 有人認為,與用於預測的多因子模型相比,用於業績歸因的多因子模型,對因子之間的低共線性要求更高,請解釋可能的原因?
用於業績歸因的多因子模型的目的是要把業績的來源分解到各個因子上,因此因子之間的低共線性要求更高。
49. 業績歸因將組合收益分解為若干個因子上的收益和一個特異收益。一位有技術的定性投資經理(基於實地調研和對某些行業、公司的洞察力)的歸因結果應該是什麼樣子?一位利用多因子模型量化選股的投資經理的歸因結果應該是什麼樣子?
定性投資經理可能更加關心自己在行業配置以及在特定行業內的選股能力;而多因子模型量化選股的投資經理更關心組合在各個風格因子上的暴露。
50. 在對一個已知策略邏輯大體思路的投資組合進行業績歸因時,採用標準的因子組vs採用針對性的因子組各有什麼利弊?【採用標準因子組便於與其它組合橫比;採用針對性因子組便於與自身策略邏輯縱比】
採用標準因子組便於與其他組合橫向比較在各個風險因子上的暴露程度,但如果該組合需要主動暴露一部分風險,則採用針對性的因子組可能更加能夠了解該組合的實際風險情況。
51. 多因子業績歸因系統輸出的結果中,特異收益(specific return,即不可被因子解釋的收益)如果顯著地偏正或偏負,怎樣解釋?怎樣調試歸因系統來消除偏離?
說明有持續性的高估或低估,現有多因子業績歸因系統並不能完全解釋收益來源,需要加入新的因子。
52. 純多頭組合業績歸因時,以總頭寸或者主動頭寸(=總頭寸-基準頭寸)為分析對象,各有什麼利弊?
等各位大牛指點。
53. 如果不知道組合持股明細,只知道組合每日收益率,怎樣對它進行多因子業績歸因?誤差會放大多少?
在不知道組合持股明細、只知道組合每日收益率的情況下,只能採用外部歸因,可以採用常見的回歸法進行分析。可以參見帖子,文中給出了一個外部歸因的範例。
54. 多因子業績歸因模型怎樣與Brinson業績歸因模型整合使用?
Brinson歸因看的是主動收益在選股能力和行業配置能力上的分解,而多因子業績歸因主要是看組合在各個風險因子上的暴露情況,可以一起使用。
55. 利用多因子模型進行選股,求解每期股票權重的問題本質上是一個帶約束的最優化問題,請闡述優化目標和約束條件各是什麼?
優化目標是在一定風險條件下的收益最大化或者是在一定收益條件下的風險最小化;其約束條件有,對於可行域(可選股票池)的約束、持倉權重大於0且總權重小於等於1的約束等等。
歡迎關注作者不詳探討交流,文中很多都是個人在多因子處理中的見解,說的不對請大家多多指點。
推薦閱讀:
※【量化】採用多元線性回歸法進行多因子分析
※多因子選股+權重排序策略3.0
※barra風險模型因子計算中的半衰期?
※多因子模型的因子有效性檢驗?