隨機生成的阿爾法

一個常見的策略就是買入一籃子有正阿爾法的資產,賣空一籃子負阿爾法的資產,然後持有一段時間,這個資產組合即可以對沖系統性風險,甚至只需要很少的初始成本來構建,因為賣空的資產提供了買入另一端的資產的資金。

為此,研究員首先確定一個定價模型,在實踐中一般使用多因子定價模型,形式如:

r_{it} = beta^prime f_tquad i = 1,dots, N; t = 1,dots,T

其中r_{it}是第i個資產在t時間的超額收益。f_t是因子向量在t時間的值。在實踐中,quant對樣本中的每一個資產跑一個對應的時間序列回歸如下,對i = 1,dots, N每個資產都進行時間序列回歸

r_{it} = hat{alpha} + hat{beta}^{prime} f_t + e_{it} quad t=1,dots, T

判斷一個資產是否有阿爾法就是對上面這個時間序列回歸中常數項做假設檢驗,顯著則接受這個資產有阿爾法的假設。為了方便討論,我重新寫在這裡:

  • 原假設: alpha = 0
  • 備擇假設: alpha ne 0

問題來了,假設檢驗中,我們常設置一個顯著性水平(比如5%),它的實際意義卻經常被忘了。這裡的顯著性水平是研究者設定的允許的第一型統計錯誤(Type I Error)發生的概率。即:

mathbb{P}(text{test rejects }H_0 | H_0 )

以找阿爾法的例子來說,這個5% 的顯著性水平是你人為設定的概率,當這個資產實際上沒有阿爾法的情況下,你還是有5%的概率認為它有阿爾法。

這本來不是什麼大問題,不過有些人找阿爾法的流程是這樣的:

  • 對股票池中的所有股票進行時間序列回歸,留下有阿爾法的那部分
  • 對有阿爾法的股票進行資產最優化組合,確定持倉比例
  • 交易

就拿上海主板來說吧,就有超過1100支股票。如果你的定價模型足夠好的話,大部分股票應該都是沒有阿爾法的。姑且假設先驗概率中100支股票有阿爾法(這已經很多了),剩下的1000隻股票沒有阿爾法。再姑且假設你運氣好,把那100支有阿爾法的股票都找到了。但是那剩下的那1000支沒有阿爾法的股票裡面,還是會有1000 * 5% = 50支股票會是統計顯著的。

那麼你就找到了150支有阿爾法的股票,但是其中三分之一的股票實際上都是沒有阿爾法的。接下來你再怎麼優化也沒什麼用了,garbe in grabage out。

推薦閱讀:

如何看待宏盛國際掌上品非法吸資證據不足,被珠海公安扣押7月的案件?
史上最全的金融投資系列書籍51-100
房地產開發商通過信託融資什麼意思?他們是如何操作的?
一頁南洋?· 文東記

TAG:金融 | 资产管理 |