Alpha系列（二）——從MPT到APT

06-25

來自專欄量化研究每周精選

從MPT到APT

CAPM和APT是現代投資組合理論的基石，在這篇教程中，我們闡述了CML和CAPM的關係，以及APT和CAPM的差異和不同，從而幫助讀者在正式理解主動投資管理框架之前，打好理論基礎和知識。（完整策略代碼點擊下方查看原文查看）

夏普組合與CML

我們在上期的教程中，已經證明了最優夏普組合就是在有效前沿上夏普比最大的風險資產組合。然而可以證明，在EMH的假設條件下，且在均衡狀態下，最優夏普組合就是市場組合（市值加權組合）。

不過關於這個論點，有幾個大家需要注意的地方：

這個是有效市場假說下的推論，讀者可以選擇不相信這個假說
這裡的市場組合包含了全市場所有的風險資產，如股票、期貨、金屬、外匯、房地產、古玩等等
有效前沿是一個凸函數，在投資者均方投資決策的條件下，任何偏離最優夏普組合的行為都會得到糾正

有了上述總結，相信大家對這個結論也會有自己的判斷。為了闡述後面的內容，教程後面將視最優夏普組合與市場組合為同一個概念，但是大家心裡要清楚這裡的前提假設和背景。

現在，為了引出CML資本市場線的概念，我們在風險資產外，加入了無風險資產的概念。

然後我們要介紹一個非常重要的定律，即分離定理：指在投資組合中可以以無風險利率自由借貸的情況下投資人選擇投資組合時都會選擇無風險資產和風險投資組合的得最優組合點，因為這一點相對於其他的投資組合在風險上或是報酬上都具有優勢。所以誰投資都會都會選擇這一點。投資人對風險的態度，只會影響投入的資金數量，而不會影響最優組合

我們的組合方差為：

於是，我們得到CML的顯示錶達式：

風險溢價

上式中的E[rm]?rf/σm我們通常稱之為風險溢價。分子表示超額收益，即超出無風險資產收益率的報酬，分母表示組合風險（標準差），這個指標在經濟意義上就是表示單位市場風險下的報酬，其實也是市場組合的夏普比率。CML的斜率預示了為了承擔額外單位風險所需要支付的報酬，因此也被稱為市場均衡價格下的風險。

換句話說，我可以可以這麼理解和表示：

詳細代碼點擊下方查看原文查看：

CAPM資本市場定價模型

在均值方差分析框架里，至少需要兩個輸入，即預期收益率和協方差矩陣。先暫且不說預期收益率，對於有N個股票的協方差矩陣，我們需要估計N(N+1)/2個變數（方差及協方差），這個在實踐中被認為是非常困難的任務，事實上，如果考慮到估計誤差和動態特性，協方差矩陣的表現非常像量子力學裡的隨機矩陣，即大部分信息只集中在一兩個特徵值上面。因此，Sharpe、Tobin和Lintner 發展了一個結構更加簡單的模型——CAPM。

CAPM把股票風險分解為系統風險和非系統風險：

其中：

這裡的θi經常被稱為非系統風險。CAPM假設單個股票的系統性風險與非系統性是相互獨立的，另外，它還假設不同股票間的非系統風險也是相互獨立的。

CAPM下的協方差矩陣

可以從協方差的定義，很容易證明：

對於組合權重為W的組合，組合beta就是股票beta的加權平均，即βp=wTβ。

組合方差為：

正如我們所期望的，組合方差被分解為系統風險和非系統風險構成。

風險分散化

這裡我們專門簡單地講一下為什麼在CAPM的框架的，非系統性風險是可以被分散化的。為簡單起見，我們假設所有股票都有相同的非系統風險（相同的方差），那麼一個等權重的股票組合的非系統性風險為。如果單個股票非系統性風險為30%，那麼對於100個股票的組合它的非系統性風險只有3%，對於400個股票的組合非系統性風險只有1.5%。而系統性風險並不依賴於股票數量，僅僅是組合beta與市場風險的函數。不過，對於一隻多空市場中性的股票組合，我們可以構造一個多空市場中性的股票組合，它的組合beta為0，即沒有市場風險。當然了，這個非常依賴我們對beta估計的準確性。

但如果我們每個證券組合存在相關性，那會怎麼樣呢？讓我們假設一個股票組合證券兩兩相關性為ρ，那麼包含N個股票的組合風險為：

當N很大時，

所以，我們可以通過股票數量以及股票與組合間的相關性來降低組合總體風險。

CAPM實驗

在下面的實驗中，我們選取了平安銀行和中證800的月頻數據，然後計算它們的後驗beta值，根據我們的計算得到了1.063的估計值。為了畫出CAPM，我們還需要市場無風險利率，於是我取了shibor-1M的數據，並在收益率的散點圖上疊加了我們的CAPM曲線。從圖中可以看到CAPM很完美的捕捉到了他們的關係，接著我們還對中證800和平安銀行進行了線性回歸從而得到了它們的回歸係數，即1.067，R2為63%。我們可以看到，我們的後驗beta仍然落在了線性回歸係數的95%置信區間內,(0.938,1.196)。（詳細代碼點擊下方查看原文查看）

SML證券市場線

這裡再簡單介紹下證券市場線。SML可以直接從我們對CAPM的定義得到，然後CAPM認為，在市場均衡的狀態下，所有的股票都應該落在SML上，如果不是，那麼將存在套利機會。即我們可以賣空位於SML上面的股票，買入SML下面的股票，因為CAPM假設它們最終將回歸到SML。

在下面的實驗中，我們利用中證800指數的成分股數據，估計每個成分股的beta，並且在SML上展示了去年十月份的SML和個股的beta-收益對。我們可以看到，在這個時間片上，股票個股的當月收益與beta似乎關聯性並不強，而且SML似乎還有一點系統性地高估。為了展示一種分析方法，我們在SML上下設置了閾值區間，用以區分高估和低估的股票，這裡的閾值的設置沒有一般規律，可以人為，也可以根據分位數。有興趣的讀者可以更近一步，把前後連續的兩個月股票收益與SML的預測收益的離差作為一個事件，進行事件研究。（詳細代碼點擊下方查看原文查看）

APT套利定價模型

因子模型

對於投資組合，我們有：

我們的協方差矩陣：

其中，B就是我們的暴露矩陣：

ΣI是因子的協方差矩陣，S則是股票的特異風險。

APT假設任何股票的收益都與一組因子線性相關，bij代表股票i的因子j的暴露程度或者敏感性，?i代表股票i的特異收益率回報，其均值為0。它還假設股票的特異收益率在不同股票之間彼此不線性相關，股票因子與因子之間不線性相關。

無套利均衡

無套利均衡是現代金融理論的重要概念，我們首先來定義套利機會：

1)不需要任何投入,自我融資(self-financing):

2)對所有因素風險完全免疫：

3)對所有非因素風險完全免疫:

4)當資產數目足夠多時,期末可以獲得無風險收益:

無套利原則就是市場在均衡狀態下不存在無套利機會。

APT與CAPM

CAPM和APT都是風險模型，然而它們之間存在著重要區別。首先，CAPM假設只有一個因子，即超額收益，對超額收益的暴露就是股票的beta。另外一方面，APT則要通用的多，但在APT模型中，它並沒有告訴我們存在哪些因子以及因子數量，並且APT沒有告訴我們怎麼具體得定義和衡量股票對因子的暴露。APT在定義上的寬泛引發了一系列的問題，其中一個就是使得這個理論難以在實踐中被檢驗。同時，它的靈活性也提供了許多方法和思路去探究股票收益的生成過程。因此也引發了很多研究和一些商業應用，其中比較有名的就是BARRA風險結構模型。

因子的定義

這裡著重介紹下，我覺得大家好像特別容易把因子和特徵搞混。在APT的標準定義里，每個股票的因子fk是相同的一組變數，注意這裡並不是fik，i代表股票，k代表第k個因子。我畫了一個圖，來幫助大家理解。大家可以看到，左邊的兩列分別代表股票和時間，後三列代表的是三個不同的因子，圖中因子下面的單元格的不同顏色代表不同值。不難發現，圖中每個股票每個時間下面各個因子的顏色（值）是一樣的，也就是說因子變數在不同股票間是共享的，每個股票的因子數據就是所有股票的共同因子數據，不過是在不同股票間重複而已。作為對比，我還列了一個一般意義上表示特徵的表格，大家可以發現在特徵表格中所有的值在一般意義上都是不同的。

這裡給出了一些挖掘潛在因子的先驗指南：

它們能夠捕捉價格的非預期變動
它們應該表示無法通過分散化來抵消的影響因素，所以更可能是宏觀經濟因素，而不是股票或公司特有的因素
能夠獲取及時且準確的信息
它們之間的關係應該有經濟學理論解釋

下面我們給出了一些建議列表：

通脹率
油價
匯率
商品、貴金屬
股票指數
短期利率

所以在APT的框架邏輯是，通過因子建模和挖掘，捕捉股票的系統性特性，而非系統性特性通過組合分散化的技術可以消除。在實踐中，如果我們需要捕捉股票的特異因素，就再加入股票的特異特徵就可以了，比如市盈率、市凈率。只不過在傳統統計建模視角，每個股票的非特異因素可能是不同的，或者說對不同的特異變數的t檢驗的顯著性是不一樣的，那麼作為單個股票的收益預測模型，似乎沒有必要加入不顯著的變數，然後在一隻股票上的不顯著變數在另一隻股票上可能是統計顯著的。而且在實踐中每個股票都有不同的收益預測模型似乎也是缺少實踐性的。但是在統計學習或者機器學習視角，我們關注的是特徵，不太關注特徵本身的統計性質，機器學習能夠比傳統統計技術獲得更高的泛化能力和更好的預測性能，相比犧牲了一些模型的詮釋能力，而且機器學習更能夠捕捉特徵的非線性特徵。

Fama-French 的三因子模型

下面我們演示如何得到Fama-French的三因子模型，分別是市場因子，規模因子和價值因子。規模因子我們用中證100和中證500的差，價值因子我們用市凈率排名前25%的股票市凈率之和減去排名後25%的股票市凈率之和。然後我們對這些因子分別做了規範化和極值處理。最後我們抽了1000多隻數據全的股票做線性回歸，得到R2接近30%的三因子模型。

這裡只做演示，因子的定義及因子的處理或許有更好的方式，也沒展示訓練與測試階段模型的性能對比，同時我們用的是截面數據，在實際收益預測時，當期因子是未知的，我們也沒有就這個問題展開（思路是構建專門的因子預測模型，或者因子的一致預期，或者用滯後一階的歷史數據作為因子）。後續因子檢驗和因子建模的課程會詳細展開這些問題，讀者有不同想法可以在帖子留言討論。（詳細代碼點擊下方查看原文查看）

總結

最優夏普組合是CML與有效前沿曲線相切，是有效前沿上夏普率最大的風險組合
有效市場假說認為，最優夏普組合就是市場組合
CML是由無風險資產和市場組合（風險資產）的加權組合，投資者應該在CML上選取投資組合
CAPM認為股票收益尤市場風險和特異風險組成，beta衡量股票超額風險的暴露程度，市場組合的暴露程度為1
SML是在CAPM下衡量股票均衡定價的一個工具，應該賣空SML上方的股票，買入SML下方的股票
APT提供了一個股票收益多因子模型框架，是比CAPM更一般的模型
APT靈活度很高，在實踐中很難對模型進行檢驗
因子應該代表股票的共同因素，而不是特異因素

開放性問題

在MPT框架下，CML是夏普比率最高的投資組合，如何解釋一些共同基金、私募擁有超過市場組合的夏普比率？
夏普比率的計算在樣本選擇、抽樣方式以及樣本分布上有什麼關係和規律？
我們通常得用夏普比率來衡量投資組合真的能真實反映投資績效和基金經理的能力嗎？

下期預告

從主動投資管理的角度闡述alpha、因子和主動投資定律

策略完整代碼：《Alpha系列（二）——從MPT到APT》

本文由BigQuant《量化研究每周精選》原創推出，版權歸BigQuant所有，轉載請註明出處

更多精彩文章歡迎前往BigQuant社區查看並參與討論：BigQuant人工智慧量化社區
加入 人工智慧量化投資交流群，與大牛共討人工智慧量化話題：微信搜索 bigq100，添加微信群管理員微信，附上姓名、所在機構、部門和職位，審核後管理員會邀請您入群。

關注 BigQuant 微信公眾號，及時獲取新鮮資訊：微信搜索 BigQuant，獲取更多人工智慧、Machine Learning、量化投資相關文章。