選擇與未來入門notes

06-05

選擇與未來入門notes

來自專欄 Hai, World！

今天我們就來談一談選擇與未來(options and futures)，討論一些寶貴的人生經驗。

我想要達到的效果是，只要看了這一篇文章就可以深刻理解BS方程，讓你在金融市場永遠立於不敗之地，遇神被神殺遇佛被佛殺~

CERN的data今年最後一年收集完畢我也終終終終終終終於要解放了，也需要好好準備找quant的工作。感興趣的童鞋也feel free加微信交流哇，693960928

很多盆友都看過董可人幾年前關於兩種quant類型Q quant和P quant的回答，這也是純潔懵懂學物理的我第一次接觸到quant這個高大上的領域，看的面紅耳赤小鹿亂撞心怦怦直跳。當初看完一臉憧憬外加一臉懵逼，但現在經過兩三年的努力，我現在終於對這兩類quant的內容都有了比較深入的理解和認識，只剩下懵逼了。

(1) Q quant是theory driven，從市場風險中性出發，做衍生品pricing或者structured product，也是一直以來比較傳統的quant，主要是上世紀大家發現物理里的布朗運動和解偏微分方程可以用在金融市場上對衍生品的定價(後面理論部分會具體解釋)，就招了一大批物理學家和數學家專門研究衍生品和量化風險。當然，這種結構化的產品的濫用也導致了08年的次貸危機，而且其實大部分的定價工作已經很成熟並且自動化，不太需要大量數學物理phd去貢獻腦力做重複工作，市場上衍生品mispricing的套利機會也不再那麼juicy，行業進入了比較穩定飽和的階段。(一句話概括，物理不好找工作了)

(2) P quant是data driven，也就是現在比較流行的統計quant或者data scientist，具體是藉助統計模型來做多因子，risk和portfolio management，統計套利等等內容，疊加現在的big data還有machine leanring/deep learning的東風，行業進入了迅速發展的階段。(一句話概括，統計好找工作了)

(更詳細的描述在其推薦的這個paper裡面: https://papers.ssrn.com/sol3/papers.cfm?abstract_id=1717163)

我在這篇文章教你Machine Learning玩轉金融入門notes裡面對P quant做了比較詳細的介紹，這裡主要介紹第一種傳統的Q quant。

但我認為這兩種quant的技能其實都應該掌握，學的越多越發現金融市場是一個很複雜的系統，特別是如果想要管理好一個portfolio是需要對每一塊兒領域都有一定的理解並且為我所用。所以這也是為什麼我分別寫了Macro和Machine Learning之後又想寫這篇文章，在建立起市場宏觀的大框架之後同時利用data driven的統計模型和theory driven的衍生品來幫助自己靈活實現具體的目標，希望能幫大家對整個金融市場有一個比較全面的了解。

說到期權就避不開一個東西，這其實也是我想寫這篇文章的主要原因，那就是波動率volatility。先上一張圖感受一下:

大家應該依然對年初美股的大跌印象深刻，引發了全球股市包括A股的大跌。大跌的原因暫時也是眾說紛紜，主要的trigger應該還是似乎一夜之間市場對通脹的預期就高漲起來，無論是原油還是美國經濟數據強勁驅動，引發了長端美債利率的大漲，傳導到了美國的股市引發了螺旋踩踏式的降槓桿。至於是哪些機構在降槓桿，首當其衝的自然是一直以來crowded躺著撿錢做空vix的fund和個人了。然後當天就有機構把大量資金從股市轉移到債市，下圖的換倉簡直不要更明顯(注意這裡債券是利率)。這部分的機構可能是養老金也有可能是risk parity，也可能是從index fund出來的資金尋求避險(最近也有消息說97%的vanguard household在這次turmoil中並沒有trade)。

當天確實很有紀念意義，我學到了很重要的一課，也發了好幾條狀態:

當年次貸也只是電影裡面感受過，有些東西沒有經歷過確實想像不出來。不管之前的A股大跌還是現在的美股大跌，或者更早之前的幾次危機，說白了都是因為bank run進而踩踏導致螺旋下跌，無論經濟基本面怎麼樣，只要是有credit這個東西的存在就會導致市場比看上去thin得多，並且越有效越會刺激加槓桿去獲取那稀薄的超額收益，思考的越理性和複雜反而會離人性和情緒更遠，也更不容易看到身邊所發生的事情。

還有就是知行合一，雖然去年好幾條狀態都是推薦一邊long大盤然後用收益去long vix的option來bet這些spike，但確實自己也不太篤信能堅持到這一刻到來，錯失機會並不可惜，比如比特幣漲這麼多我也不會覺得可惜，畢竟之前也不了解和判斷，但對於vix確實可惜的是沒有堅持自己先前的判斷。

遺憾歸遺憾，錯過的機會其實也是一個很好的學習機會。未來全球各國普遍進入緊縮環境，隨著volatility的回歸，國內金融市場也會對期權逐漸熟悉起來，以後不懂期權不僅會錯過更多這樣的機會，更重要的是以後金融市場的發展趨勢肯定也是像美國這邊一樣利用衍生品(option，future，forward，swap等等)有針對性的精確控制自己portfolio的各類risk exposure，這一塊兒會是每個機構和fund需要掌握的必備技能。

所以呢，這裡暫且作為一個比較intuitive的介紹和入門，更細節和理論的東西還是需要去看書(文末有推薦的書單)。

這篇文章呢分成兩部分，

(1) 第一部分是期權各種不可描述姿勢的推倒，我們熟悉的BS方程其實只是一個結果，其前面的推導過程貌似很多盆友也不是很熟悉，但我覺得前面的假設和一步步建模才是最有insight的地方，到了BS方程其實就已經只剩下求解偏微分這種苦力活。我半年前剛學這一塊兒的時候沒啥人指導也是學的比較零零散散，如果一開始就有一篇把整套邏輯都清晰梳理出來的文章會節省我不少精力，最近自己也確實需要認真準備quant的東西，正好試著來做這樣一件事，權且當自己對這個部分的總結，也看看自己有沒有理解錯誤的地方；

(2) 如果對公式不感興趣或者已經很熟悉的盆友可以直接跳到第二部分，是我在學了BS公式之後對市場本質上的一些疑惑，歡迎開放性的討論。

吶，首先還是給一個FBI Warning，我是粒子物理專業，這些全都是自學的，所以如果出現了民科的地方請不要見笑，比個心~

1.期權入門

1.1 Black-Scholes Model

1.2 Greeks

1.3 Implied Volatility and Volatility Surface

1.4 Random Walk

1.5 Brownian Motion

1.6 Stochastic Calculus

1.7 Markov Process and Martingale

2.我們為什麼能賺錢

1.期權入門

下面開始盡量入門的介紹，我會先從比較實用的定價部分開始，然後再介紹比較理論推倒的部分。

其實想要真的掌握期權，特別是對期權hedging的操作，理解理論的數學公式肯定是逃不掉，我也會給出一些自學時候的理解，希望也能讓同樣沒有相應背景的朋友理解起來更加直觀一點。(就像machine learning一樣，能用package只是很表面的skill，真正限制自己的是理解的深度，能從理論上融會貫通各個model什麼時候應該怎麼用會出現什麼問題才是核心的競爭力)

1.1 Black-Scholes Model

首先，BS公式是期權定價的核心(摘選自wiki)。

上面這個方程就是傳說中的Black-Scholes Model了，具體怎麼得到的我們在理論部分會進行介紹。這個地方的V呢就是我們想要得到的call option的價格，之前提到的數學家和物理學家做的其實就是通過上面這個偏微分方程得到V的解，我們暫時先跳過這一部分的推導直接看方程的結果。

上面的第一個式子就是BS model的解了，也就是call option價格的解析解，這也是後面著重介紹的內容。

但期權定價其實是有兩部分，除了call option之外我們還有相應的put option，第二個式子其實就是通過put-call parity的關係，再結合第一個式子得到的call的價格來對put定價。

put-call parity的主要思路是設計兩個收益相同的portfolio(一個含有call一個含有put)，自然他們定價也是一樣，從而構建出call和put的等式，理解如下，

我們回到第一個部分Call的定價C(St, t)。

可以看到這個式子中有5個參數。對於固定某個時間T，股票的價格是St，call option的strike price執行價格K，也知道這個call的maturity到期時間(T-t)，也知道risk free rate無風險利率r，正態分布N(·)的形式自然也都知道，剩下的一個就是傳說中的volatility $sigma$ 。

當我們知道了call的理論價格之後呢，我們就可以利用第二個式子得到put的理論價格，同樣也是受到這5個相同參數的影響。

這幾個參數對期權價格的影響在上面的公式里可能看起來不是那麼明顯，下圖可以幫我們有一個大概的感覺:

(下圖拍自綠皮書 A Practical Guide to Quantitative Finance Interviews，推薦大家買來看看，無論是不是金融專業)

上面這個圖就很清楚可以看到每個參數對期權價格的影響，但是只能告訴影響的方向(向上或者向下)，而不能告訴我們具體上上下下的幅度到底是多少(好像這麼形容總覺得有點怪怪的，但身體卻很誠實 ╮(╯▽╰)╭ )

我們有從BS model得到的call option關於這5個參數的解析解，在市場中我們還可以得到這5個參數確切的值(這裡暫且不討論dividend)，就會想怎麼衡量市場不斷動態變化時相應這些參數的變化對option價格的影響幅度呢(比如說我預計明天股價會漲一塊錢，那麼期權價格會漲多少呢)。

從數學的角度，很自然我們就會聯想到用一階導數。因為一階導數f(x)代表的就是x的變化對於y值的影響大小。

所以我們也就想到可以把call option價格的這個解析解對每一個參數都求一階導，這樣就可以知道每個參數的變化對期權價格的影響大小。這裡也就是期權hedging的核心部分了，Greeks。

1.2 Greeks

下面這個表就是每一個greek代表的一階導和二階導的具體形式了，下面我們來具體介紹每一個greek。

Delta

首先我們要介紹的就是delta，也就是期權價格對股票價格的一階導，或者說股票價格的變動對於期權價格的影響大小。

但在介紹delta之前，我們需要對期權這個概念有一個大概的了解:

期權本質上交易的是一種未來的權利，而不是underlying asset本身。

每個期權都有一個特定的strike price，意思是到時候的行權價格。我們知道期權可以用來bet未來的股價漲跌，然後到期的時候是以strike price的價格來成交。

比如我買了蘋果公司strike price@100塊的call看漲期權，也就是未來到期的時候我可以根據實際情況選擇要不要按照100塊每股的價格從賣我期權的賣家那兒買一定數量蘋果公司的股票。假設到期的時候股價變成了110塊，那我自然願意將這個期權行權把股票用100塊買回來，因為轉手在市場上賣掉每一股我就可以賺10塊。但假設到期的時候股價反而跌了，變成了90塊，那麼我一般就會選擇放棄這個期權，因為這樣如果還用strike price@100塊買回來就是虧的。對於put這就是反過來，因為put是看跌期權。

我們把這個例子畫成一張圖，這是call的收益 VS 到期日股價spot price:

這裡圖中$100是期權的strike price，到期日蘋果公司股價正好等於strike price的時候叫做At The Money(ATM)，我們可以根據這個值把這張圖分成兩個區域。

對於call來說，到期日如果股價小於期權strike price的區域叫做Out of The Money(OTM)，大於的區域叫做In The Money(ITM)。

我們也可以看到當股價大於這個strike price 100的時候我們的profit是正的，並且是隨著到期的股價越高我們的profit越高，斜率為1。簡單一點來說就是當股票的價格大於strike price，也就是ITM的時候，我們的call期權才有正的profit。當到期的股價如果是處於OTM的時候，這個時候我們的profit是0。

對於put來說就是反過來如下圖，未來股價大於strike price的區域叫做Out of The Money(OTM)，小於strike price的區域叫做In The Money(ITM)。

從這個例子我們就可以看到，在到期的時候，無論是call option還put option，當到期日的股價處於ITM的時候我們的收益就是正的，並且ITM的程度就決定了我們的期權收益。這個很重要的概念就是moneyness。為了簡便其實很多時候大家都不太關心股價和strike price的絕對值(從BS公式裡面可以看到這兩者在d1和d2里從來都是成雙入對出現的)，而是直接用他們的比值moneyness來表示ITM和OTM的程度。這樣100%就是代表的ATM，越偏離100%就說明越deep ITM或者deep OTM。(現在moneyness的概念就清楚很多了，後面還會在volatility surface里再提到)

需要注意的是，上面為了簡便並沒有考慮期權的時間價值這個參數(T-t)，或者說我們把BS式子(1)裡面的time to maturity (T-t)這個參數看做了0，也就是只考慮了行權日的情況。

現在我們把這個參數加回去就可以得到如下的圖：

這張圖的x軸是股票未來的價格S，y軸是call(藍色)和put(紅色) option的價格。這裡先忽略那個underlying movement，其實代表的就是put-call parity，或者說call減去put的差值就是這個股票的forward的價值，後面會進一步解釋。

這裡我們可以看到之前簡單粗暴的分段函數被光滑的曲線代替，但是在ITM和OTM的時候還是會無限接近之前的分段函數，差別最大的地方就在於ATM，這個地方因為不確定性最大所以這個期權的時間價值最大，後面theta的部分會講。

回歸到delta。

既然我們現在有了call和put價格光滑的曲線，delta又是期權價格對股票價格的一階導，所以call和put的delta值其實就是這藍紅這兩條線的斜率大小，我們畫在一張圖上：

根據call和put的斜率和0的大小，大於0的delta是call，小於0的delta是put。

並且我們可以明顯看到call的的delta減去put的delta的值為1，這個也是由於put-call parity決定的。

我們把上圖改一下，x軸換成moneyness(注意call和put的moneyness是反的)

這個圖看起來就更為直觀，我們可以看到call和put的delta在根據moneyness畫出來的時候是對稱的。所以相對moneyness，我們可以直接把call和put看做同一種東西，只是符號相反，這樣處理起來比之前相差一個常數用起來更為方便。

並且在deep OTM的時候，put和call的delta都是0，因為當deep OTM的時候期權其實就沒有價值了，所以也就不隨著underlying股價的變化而變化；而deep ITM的時候delta都是1，因為當deep ITM的時候underlying股價完全dominant期權價格，而其時間價值可以忽略不計，一比一的完全跟隨underlying股價變化而變化。

現在我們知道了call和put的delta，聰明的你可能會問，既然delta的定義是期權價格對於股價的敏感度，比如股價漲1塊錢，我的call期權就會漲一個delta的價格，那我如果現在買了delta個期權的同時再short一個股票，我的整個portfolio不就不會隨著股票價格的波動而波動了么？

這就是現實期權和portfolio操作裡面很重要的一個部分，也是理論推導BS model裡面很重要的一個insight，那就是delta hedging。

具體的內容就是根據自己portfolio算出來delta是多少，然後short相對應數目的股票，這樣就可以使得整個portfolio的delta為0。大概的圖就是這樣(網上搜了半天都沒找到類似的圖，只有自己畫了…):

可以假設一開始我們拿著一個call，但是我們想要讓這個call呢獨立於股價S的變動，這個時候股價在S1，我們算出來這個時候的delta是delta1，然後我們short了delta1個股票，使得當下的delta變成了0，也就是現在整個portfolio(這個call-delta1個股票)已經幾乎獨立於股價變動了。然後過了一段時間股價變成了S2，此時我們又需要重新hedge delta使其再次變成0，算出來此時的delta是delta2，但是是負數，所以我們此時應該long delta2的股票，然後整個portfolio就變成了這個call-delta1個股票+delta2個股票，再次獨立於股價的變化。

有的同學可能會有疑問，為什麼我們想要整個portfolio獨立於股價的變動呢？

那是因為這樣利於我們控制整個portfolio的風險。我們可以選擇性的暴露一些風險來獲得收益，但又不想讓整個portfolio完全裸露在市場的波動下，而期權就正好可以用來幫助我們精確地hedge掉各項風險。

有的同學可能還會有疑問，不是說portfolio的delta為0的時候就已經獨立於股價變動了么，為什麼還要hedge來hedge去的？

這是因為我們一階導的delta已經hedge掉了，但是由於這個加入了時間價值的曲線並不是linear的函數，而是exponential的(可以看到BS的解裡面的exponential項)，所以還有更高階的curvature我們並沒有hedge掉。沒有完全hedge掉風險更根本的原因我感覺其實是在運用Ito』s lemma的時候我們僅僅用了一階展開，從而更高階的布朗運動其實是被忽略掉了。我想如果在用Ito』s lemma的時候如果展開到higher orders，那麼是不是這一塊兒就會被自動考慮進hedgeing這個部分，但方程肯定會複雜的多，不知道有沒有人試過。

當下我們還是回到傳統的delta hedging。那可能又有疑問了，如果是exponential的話那hedge的階數不是子子孫孫無窮匱也了么？

幸運的是，這個曲線的高階導數的變化並不是那麼快，甚至delta的變化都並不是那麼大(只需要隔一段時間hedge一次)。所以我們最多就需要再hedge二階導數，也就是下面要講的gamma了。

當然這裡需要提一下，其實像高階的Gamma這一類的curvature也是可以hedge掉的，但是不能通過long/short股票的方式(因為underlying asset只能線性的hedge)，而是只能通過其他有相同curvature的衍生品來hedge。

Gamma

我們知道gamma是期權價格對股價的二階導，其實也就是delta的一階導。

首先我們上個圖，這就是gamma和delta的對比。

還有不同time to maturity的期權的Gamma：

由於上面我們知道call和put的delta只相差一個常數1，所以call和put的gamma是identical的，並且都是正值。

而且圖中我們也可以看出來gamma在ATM的時候最大，也就說明了delta在ATM的時候斜率最大，即對股價的變化最敏感。

並且從gamma的公式裡面的分母可以看出來，如果time to maturity是0也就是行權日的時候，gamma就變成了「delta」 function。此時的delta是step function，也就是要麼0要麼1。

而且在上面delta hedging的圖裡面，細心的童鞋也許可以發現我畫的整個portfolio的return在每次股價變化的時候是越來越高的。

這是因為通過對比Gamma和Vega(後面會介紹，是對波動率的一階導)的式子我們可以發現，

這一段是來自於Taleb的dynamic hedging這本書。

所以我們在delta hedging過後還有long Gamma的時候，其實也是在long Vega，也就是long volatility。當股價變化的時候，無論是漲還是跌，都會貢獻volatility，也就都會讓我們有正向的收益。

所以有句話叫買期權其實就是在long Gamma，也就是在long Vega和volatility。

但是，怎麼感覺像天上可以掉餡餅的感覺呢？整個portfolio沒有了跟隨股價波動的風險，當股價波動的時候還會給我們帶來收益？

天上自然是不會掉餡餅。

世上沒有永動機，自然也沒有高額的無風險回報(下面講了理論部分之後會體會更深)。

這是因為我們還有Theta這個東西，也就是接下來會講到的另一個greek。

Theta

Theta的定義是期權價格對時間(準確的說是time to maturity)的一階導。

我們可以先看看Theta的圖長什麼樣子：

從圖裡面我們可以看到Theta的值是負的(這句話其實並不嚴謹，因為如果考慮進來dividends，還有美歐式期權，Theta是有一些特殊情況下可能是正的，換句話說其實有時候提前行權是會更優，比如deep ITM的美式put)，也就是說當剩餘的時間愈來愈少的時候，期權的時間價值會越來越小。這就是為什麼上面提到的Delta hedge之後，雖然我們可以從波動率裡面獲得收益，但是一般來說Theta decay的損失會overwhelm從long Vega裡面得到的收益。當然，如果出現了long Vega大於Theta的情況，那其實就是一個很好的套利機會。

其實從BS model裡面我們可以直接從公式的角度同樣看到這個Gamma和Theta之間的tradeoff。

上面的BS equation其實可以轉化成greeks來表示，也就是

Theta+1/2 * Volatility^2 * S^2 * Gamma + r * S * delta = r * Call_price

這裡我們的delta已經被hedge，所以上式變成

Theta+1/2 * Volatility^2 * S^2 * Gamma = r * Call_price

從這個式子裡面我們就可以看到，大部分情況下，Theta和Gamma都是一負一正的trade off。當接近maturity的時候，Theta是很大的負數，Gamma是很大的正數。

並且當我們的股價S保持不變的時候，由於Gamma也不會變化，所以上面的式子裡面右邊的Call_price的變化就取決於Vega的變化，但我們又知道Theta是負值，所以Call_price的價格會隨著時間價值的消失而越來越低。

下圖是Theta相對time to maturity的變化，我們可以把速度看得更明顯：

這個圖裡面我們可以看到隨著越來越接近行權日，Theta是會變得越來越負，這樣期權的時間價值也會損失的越來越快。

下面我們來看一看期權時間價值損失長什麼樣子：

一切正如我們所料，我們可以看到期權的時間價值會由於Theta相對time to maturity的變化而損失的越來越多。

不過Theta的形狀其實也是可以利用的，比如大家都喜歡sell ATM的option。比如下圖，

我們可以看到Theta在ATM和接近行權日的時候最負，所以我們可以long一個遠離ATM的option，然後short一個接近ATM的option，這樣我們就可以吃他們中間這一段Theta。

當然，也只是理論上。。。

Vega

還是先看看Vega的式子，是期權價格對於波動率volatility的一階導：

說到波動率，可以說是期權裡面最重要的一個概念了。不過這裡暫時只講Vega，波動率volatility留到下一節implied volatility和volatility surface再詳細介紹。

上面我們可以看到Vega很明顯的skewness，應該就是由於之前提到的下面Vega和Gamma關係中的S^2導致

但是和Gamma一樣，在ATM的時候Vega也是最大值。也就是說在ATM的時候，期權價格對於volatility的變化最敏感。同樣也非常make sense，因為在ATM的時候股價或者volatility變動一點就變成了OTM，導致期權的價格會變化非常大。

1.3 Implied Volatility and Volatility Surface

(這一段節選自上一篇文章machine learning的利用PCA來模擬volatility surface，正好當時挖的坑現在填掉~)

volatility是一個什麼東西呢？volatility是波動率，也就是期權underlying的標的價格的標準差。你如果問我標準差怎麼算，我只能說去Google一下，計算講的太細節估計都看睡著了...

所以假如我們知道volatility呢，我們就可以知道這個Call的理論價格，也就可以衡量當市場上Call的實際價格是高還是低，高了呢我們就可以賣，低了呢我們就可以買。

可惜天上不會掉餡餅，因為我們不知道volatility...

接下來還得知道BS公式的假設前提:

我們就可以看出BS模型的一個弊病了，那就是它假設underlying標的價格的波動率volatility是一個常數，跟strike price還有maturity沒有半毛錢關係。

這明顯是不符合實際情況的，因為市場會對對於不同的strike price和maturity有不同的預期和偏好，導致市場對於未來波動率的預期也會不一樣。

但是！

我們雖然不能用波動率來算出來期權的理論價格，可是我們可以反過來呀~

我們有期權的市場價格，還有BS公式裡面其他一系列的變數，比如strike price K，期權的maturity(T-t)，也知道risk free rate r等等，就可以反過來求出來理論上的波動率。這樣我們就可以知道市場對於未來的underlying標的的波動率預期了。

具體怎麼算出來的，簡單一點說就是當其他變數已知也就是固定的時候，期權的價格和波動率是一個單調遞增的關係(如果對Greek有了解的，其實就是因為期權價格對波動率求一階導的Vega是正值)，所以不斷試的值就可以最終match到當下的期權價格上面，自然也就是對應的波動率的解了。

看到這兒，很多人心裡是不是在想，「尼瑪，這貨說了這麼多，implied volatility到底有啥用？」

首先呢，implied volatility對於期權玩家的重要性不言而喻。

假設市場的每個參與者都使用BS模型定價，由於模型所需的其他輸入值比如執行價格、所剩期限、標的價格還有無風險利率都是相對固定的，人跟人對於期權價格的看法就是取決於他們對於未來這個資產的波動率了。假設有一個人巴菲特附體如有神助，對於未來資產波動率的預測百發百中如入無人之境，那麼他(她)就可以根據自己預測的期權的價格跟實際的期權價格作對比來低買高賣，賺的就是別人對波動率的預測都很弱雞。

但是可惜的是，這種外星人是不可能存在的，不然早就是世界首富了。當然如果有個人弄出來一個模型可以準確預測資產未來的波動率，那也超神了。

所以對於我們一般戰鬥力只有5的地球人怎麼辦呢？

我們可以反其道而行之，利用將已經是事實的市場的期權價格代入BS公式中算出來大家對於未來波動率的預期，也就是隱含波動率。因為期權價格是市場上供求關係平衡下的產物，是買賣雙方博弈後的結果，所以隱含波動率反映的是未來市場對標的產品波動率的看法。

但是，算出來有什麼用呢？

我們除了隱含波動率，還有一個波動率叫做歷史波動率。這個東西其實算出來也挺簡單的，只要我們有underlying標的的價格變化歷史數據，就可以用統計的公式算出來標準差，也就是波動率。而且我們發現一件什麼事情呢，那就是歷史的年化波動率是處於一個區間，會有回歸均值的一個特性(做swing交易的同學應該最熟悉了)，並且離開越遠回歸的速度就越快。比如說有一個股票，歷史波動率都是在10%到30%之間，這樣我們就可以知道從現在期權市場價格算出來的隱含波動率在歷史上是處於高還是低的位置，同樣可以做到低隱含波動率的時候買期權高隱含波動率的時候賣期權。但這裡有一個問題就是歷史波動率的區間，不代表就真的不會飛出區間去，當發生重大事件或者傳說中的黑天鵝的時候隱含波動率也會變很極端，比如Black Monday的時候飛到了150，08年金融危機的時候也飛到了80。

當然，做均值回歸有點投機的感覺。有的同學可能覺得太low，我可是做價值投資的，只是想利用期權對沖一下風險。

同樣，隱含波動率也很有用的！因為當確認了自己想投資的標的方向之後，可以把隱含波動率跟歷史波動率作對比，權衡一下此時買入期權是不是划得來。也可以對不同strike price和maturity的期權進行橫向比較，畢竟都是針對同一個資產，自然希望在滿足了自己的需求買(賣)的情況下期權的價格越低(高)越好咯。

期權是一個非線性的工具，但是市場參與者使用這個工具的方法不同，還有對於這個工具的效果值不值多少錢也有不同的判斷。借路哥的說法，「有可能是在合適的價位去「賭」不符的收益，有可能是對標的的未來走勢有一定的看法，希望通過期權來表達意願，有可能是對衝掉某些風險，有可能是和歷史數據有偏離所以進場希望當前是misprice等著回歸賺錢，等等」。

好了，對於基本的期權概念應該有一個大概的sense了，接下來我們就來詳細解釋一下之前那張volatility surface的圖。

(此圖是在之前讀伽瑪交易員的一篇文章存下來的，感謝之~)

來兩個動圖感受一下：

https://www.zhihu.com/video/985880916329287680

https://www.zhihu.com/video/985862589703856128

期權交易員對volatility surface都會非常熟悉，因為這一定程度上就是自己根據市場情況做trade和進行風險對沖的基礎。

volatility surface呢，是一個三維圖，Z軸是隱含波動率，X和Y軸分別是moneyness和term(也許不同的軟體會有不同的名字，這裡借鑒Bloomberg的表示)。moneyness的意思就是期權strike price和underlying標的的價格的ratio，這裡以call為例，分為in-the-money(strike price小於underlying標的的價格，ratio小於100%的區間)，at-the-money(strike price等於underlying標的的價格，也就是圖中的ratio等於100%的位置)還有out-of-the-money(strike price大於underlying標的的價格，ratio大於100%的區間)這三種狀態。如果是put的話strike price和underlying標的價格的關係則是反過來。term的意思呢，就是不同的到期日。

所以呢，我們可以把未來每一個到期日的每一個strike price和其算出來的隱含波動率畫在一張3D的圖上，這個就是volatility surface了。上圖中右上角的是volatility VS term的二維橫截面曲線，右下角是volatility VS moneyness的二維橫截面曲線。可以說volatility surface包含了絕大部分我們需要了解的volatility的信息，而上面也介紹了volatility又是期權的核心，自然volatility surface的重要性也就不言而喻了。

Derman的報告《regimes of volatility》裡面描述vol surface也說過一句話，作為一個合格的市場參與者，如果有人跟你說volatility漲起來了，你應該問一句「哪一個volatility？」果然也是高能物理出身的，這個逼我覺得應該給滿分。

既然volatility surface這麼重要，那麼如果我們可以預測未來的volatility surface是不是就相當於我們可以預測implied volatility進行交易了呢？

因為如果僅僅根據歷史波動率進行交易，很明顯我們丟掉了其他的很多有用的東西，僅僅只留下了波動率大小這一個信息。但如果根據整個volatility surface的歷史數據進行分析，對我們的預判的幫助會更大。在知乎上面看到說成功的期權交易，是做整個曲面的變化，這涉及的是曲面的smile/skew(下面會介紹)，和曲面的整體高低位置，前者貢獻利潤的10%，後者貢獻利潤的90%。這也是為什麼建模擬合vol surface是非常重要的一件事情，特別是對於大投行需要準確對衝風險的情需求下。

好了，鋪墊了這麼多，接下來介紹利用PCA來分析volatility surface的信息。

這裡選擇的underlying標的是USDJPY(美元兌日元)，至於為什麼選這個，我感覺可能是想了解美日間carry trade的情況，而且日元是外匯市場非常重要的組成部分。

接著我們看看具體怎麼將PCA應用在USDJPY的volatility surface上面。

volatility surface是一個三維的圖像，Z軸是隱含波動率implied volatility，X和Y軸分別是moneyness和term。

對於PCA我們知道它做的事情是線性旋轉變數高位空間，將所有的變數Xi線性組合成幾個大的因子(主成分)Zi，所以問題就來了，我們的Xi到底哪些。

這裡我們有的是implied volatility，moneyness還有term的信息。但我們並不能將他們全部作為Xi，因為雖然volatility是連續的數值，但term和moneyness的信息是固定的點。

所以我感覺這裡有一個trick就是將每天的volatility的變化值作為Xi的值，而moneyness還有term的信息作為Xi的位置。

估計這麼講會有點混亂，畫一張圖就清楚了。

我們這裡可以將所有的點都拉成一條線作為Xi，然後每天都有一列數據Xi。這樣處理我們就將整個volatility surface變為了一列變數Xi，因為每天都有一個volatility surface，所以每天可以作為一個observation。

這樣就將volatility surface的問題轉化成了PCA的問題，我們想要找若干個由Xi線性組合成的大因子Zi，使得這些個Zi的方向最大程度的代表所有的點的信息(每天可以看做是這個Xi維空間上的一個點)。換做實際問題的解釋，這些Xi的信息其實就是每天的整個volatility surface的信息，然後找到的由Xi線性組合成的大因子Zi的volatility surface可以最大的程度代表歷史上所有天數的volatility surface的信息。

報告裡面呢，選取了前三個主成分Z1，Z2和Z3，分別的圖如下:

然後PCA還有一個好處呢，就是可以算出來每一個合成的大因子(主成分)對於所有點的解釋程度(上圖右下)，也就是包含了數據中多少比例的信息。具體的方法叫做「proportion of variance explained(PVE)」，做法就是算出來這個大因子的variance和數據整體的variance之間的比例。

所以這裡我們就找到了前三個大因子的貢獻率分別是88%，4.8%和3.66%，

下圖就是這三個主成分大因子在歷史上不同時間的解釋能力。可以看到第一個主成分的解釋能力保持恆定，並且幾乎都在80%以上。

知道了能代表所有歷史上volatility surface的這3個主成分之後我們自然能做的事情就很多了。

比如依據第一個主成分來判斷delta hedge ratio(這裡delta是期權價格對於underlying標的價格的一階導，可以當做期權的價格對underlying價格變化的靈敏程度)，也就是hedge delta使得整個portfolio獨立於underlying標的價格變化(但實際上delta hedge只能解決一階的hedge，二階gamma的hedge因為是非線性所以只能依靠另外的期權來進行hedge)。還可以把前幾個主成分單獨拿出來，對剩下的residual做均值0的回歸。

(上面只是用PCA來重建vol surface，其他的方法比如spline其實也經常用來做這件事，並且也有一些smoothing曲面上那些spike的方法。)

並且從這三個主成分大因子得到的volatility surface圖中我們就可以看出來一些信息，對於固定maturity的情況下當moneyness是in-the-money的時候，implied volatility是很高的，說明了隨著in-the-money的程度市場對於USDJPY的看跌程度是越來越大的。如果對於外匯市場了解的盆友可能就知道了，這就是因為日元往往被當做避險貨幣。

為了避免觀眾對外匯市場不熟悉，這裡講點日元這個特殊貨幣的背景，那就是日元具有避險功能。我大概總結了一下，僅作參考。

(1) 日本的常年低息政策，我們都知道在經濟不好的情況下就會降息，如果已經是低息的話降息的空間就有限，利率降的越多貨幣越弱勢，所以日元貶值的空間有限

(2) 同時也是由於日本低息的環境，所以國際環境好的時候很多人是借入日元然後買入其他高息的貨幣進行carry trader套利(就像美元QE的時候美國利息低大家會借入美元買入人民幣投資中國市場)，但是一旦國際環境惡化，買入的貨幣國家會實行降息然後貶值，投資的風險喜好也變為保守，這樣套利就沒有辦法繼續維持，大家就會賣出買入的其他國家貨幣然後買回日元還掉以前介入日元的債務，這樣就進一步推高日元和日本的匯率，同時也壓低其他國家的貨幣。

(3) 日本的不管政府或者民間的資本在國際環境好的時候喜歡投資海外的資產，譬如政府的養老金基金，當外部環境變差的時候，這部分資金也會賣出資產迴流日本換成日元，即使不換回日元也會買入看多日元的衍生品(期權或者期貨等)來對衝風險，都會進一步推高日元。

(4) 日元的池子大，流通性好，外部環境變好之後隨時可以再賣掉

(5) 大家只要一出事就做多日元已經是習慣了。。。所以形成了一個自我實現的循環。

其實上述對於固定maturity的情況下volatility隨著moneyness變化的現象就是有名的「volatility smile(skew)」。具體這裡不詳細說，因為模型假設的是underlying標的的收益率並符合標準的正態分布，但實際上市場上由於不同的風險偏好產生了期權的尖峰肥尾現象，肥尾的方向也就代表了implied volatility的smile(skew)方向。產生的原因也有很多paper探討，暫時沒有一個固定的說法。

對於期權有一點需要注意或者可以利用，因為漲和跌並不是對稱的，漲的時候總是緩慢的波動率低的，跌的時候總是摧枯拉朽波動率高的，期權價格呢又跟波動率有關，所以呢我們可以利用這一點。譬如說買put，一方面如果資產真的下跌，put本身由於moneyness和intrinsic value會增值；另一方面資產下跌的時候會引起恐慌增加波動率，也會使得期權增值，所以其實兩方面的動力會一起做貢獻讓put的價格飛起來很快。還記得前段時間的50 cent先生么？大家一開始都嘲笑這哥們腦子有病每天給市場送錢，現在才發現這哥們真牛逼。其實吧，他就是利用了期權波動率不對稱這一點，瘋狂在波動率低的時候掃貨買便宜的put，一旦市場有點風吹草動導致哪怕一天的恐慌，向下的利潤是非常豐厚的，遠遠超過前期裸買put的成本投入。當然，別人是建立在對當時整個市場情緒非常敏感的正確判斷前提下才敢這麼單邊做期權，還冒著成為各國基金經理永遠嘲笑的二逼的風險，這種勇氣我還是很佩服的，實至名歸。對於不了解資本市場的同學呢，不要看了之後腦門一熱以為股神附體就all in了，成功了是big short不成功就變big idiot，老婆本都虧光了不要怪我，我代表華夏三千萬單身漢同志歡迎你的加入~

還有一個關於vol的小tips也介紹一下。

我們其實還可以根據VIX的值來倒推回去期權市場對市場未來波動大小的預期，但有一個隱含的假設前提是市場收益在每個時間段都符合正態分布(這其實也是布朗運動的假設，下面我們會提到)，然後算出來一個sigma的大小，得到波動的範圍。

下面我就舉個例子會清晰很多，

首先稍微介紹一下臭名昭著的vix這個index是個什麼東西，

vix其實是從未來30天期權市場還有BS方程算出來的市場預期的年化波動率，也就是implied volatility。

(代表vol的VIX的計算公式可以參考CBOE的官方文件，http://www.cboe.com/micro/vix/vixwhite.pdf)

假如vix是17的時候，這樣根據CBOE的vix的演算法，vix=sigma*100，

所以一年收益的正態分布的一個標準差sigma的值就是 sigma=0.17，或者說是17%。

假如現在大盤spy在$265的地方，那麼一年的波動大小就是17% * $265 = $45

同樣我們可以從vix算出來市場預期的每個月和每天的的波動大小，

每月的sigma = 0.17/sqrt(12) = 0.049 = 4.9%，波動大小是4.9% * $265 = $13

每天的sigma = 0.17/sqrt(255) = 0.01 = 1%，波動大小是1% * $265 = $2.6

這個粗略的演算法可以幫助我們判斷現在的波動率是否合理，畢竟單純看波動率的絕對值其實還不是那麼直觀。

有可能有童鞋會產生疑問，為什麼這裡有一個sqrt(N)呢？

這個就是剛剛提到的隱含的假設了，也就是正態分布。

我們這裡是把比如每個月的收益當做獨立的正態分布然後加起來就變成年化的收益分布。如果學過統計的話就會知道兩個正態分布加在一起的結果還是一個正態分布，並且標準差是平方相加再開方的關係。自然這裡就是12個月的sigma^2加在一起再開方，就出來了這樣一個sqrt(12)這一項。

比如下面CBOE的vix的公式裡面我們也可以看到這樣一項，sqrt(N365/N30) = sqrt(12)。

同理粗略計算sharpe ratio的時候也會出現sqrt(n)這一項也是這個原因，因為都是對於n個單位時間的波動率的處理。更直觀一點感受一下10的sharpe，比如歷史平均年化sharpe是10，每天的sharpe就是10/sqrt(255)=0.6，假如vix像上面舉例是17也就是換算成daily的volatility是1%的時候，那麼每天的收益率就需要至少是0.6%，波動還不能比市場大，整體而言確實還是挺難做到的。這也是為什麼現在基本都是strategy pool整體來平衡收益和風險而不是單獨一個很強的strategy，因為單獨的高sharpe因子在有效市場太稀有了，內幕消息倒算是一個。

除了正態分布還有一種理解方式，下面的理論推導裡面會提到random walk的variance會是sqrt(t)，t就是這裡的單位時間的數目。(其實本質上也就是正態分布...whatever)。

並且有一點需要澄清，那就是比如Vix=17，SPY=265的時候算出來的每天波動$3其實並不是說每天一定會漲或者跌這麼多，而是說一個sigma標準差的幾率(68%)是會落在+-$3這個範圍內，不是說就一定會碰到這個+-$3這個boundary，這只是概率的一個區間作為參考，而不是某一個一定會到達的值。

好了，volatility的部分也講完了，整個應用部分就結束了。

我們現在開始進入理論的部分。

1.4 Random Walk

首先呢，我們來看一下蘋果公司的股票，前陣子跟著美股大盤大跌了一陣子，還好最近美國經濟和通脹起來之後大家似乎又對股市重拾信心了呢。

摸著自己的良心自問，有多少朋友一眼就看出來這是假的了？

這是我用Python模擬出來的(不要小看這一段程序，你知道我為了一樣模擬了多少次嘛!)，感興趣的話程序如下，

import matplotlib.pyplot as pltimport numpy as npT = 2mu = 0.01sigma = 0.01S0 = 172dt = 0.01N = 200t = np.linspace(0, T, N)W = np.random.standard_normal(size = N)W = np.cumsum(W)*np.sqrt(dt) ### standard brownian motion ###X = (mu-0.5*sigma**2)*t + sigma*WS = S0*np.exp(X) ### geometric brownian motion ###plt.plot(t, S)plt.show()

吶，其實真正的股價圖在這裡

這就說明了一個問題，我們無法區分股價和random walk。

這下面隱藏著一個更為本質的問題，也就是期權理論的基礎：股票價格和布朗運動。

布朗運動其實是愛因斯坦在1905年發的paper，在論文裡面給出了擴散方程的解(對，其實上面的BS model的偏微分方程本質上就是一種特殊情況下的擴散或者熱傳導方程)。布朗運動其實說的是花粉顆粒在不計其數的水分子(10^23個，天文數字)作用力下的運動，這個花粉的運動軌跡決定於這千千萬萬個水分子的運動和他們對這個花粉施加的力。那麼假設我們可以知道每一個水分子未來的運動方程，我們其實就可以知道他們以後在每一個時刻會怎樣來影響花粉的運動，我們也就擁有了預測花粉軌跡的超能力。但是，很可惜，由於參與的水分子太多，我們不可能完全掌握這部分信息，自然也就無從得到花粉未來的運動軌跡，所謂隨機過程。其實和熱力學也是一樣，這學期修了一門熱力學統計物理，發現這個就是我一直以來缺少的一塊兒拼圖，連接了物理的宏觀和微觀世界。物理裡面由於微觀粒子太多和不確定原理導致掌握每個粒子的信息來精準描述整個系統完全不可能，熱力學加上統計概率分布就正好成為連接量子力學微觀粒子和牛頓力學宏觀世界的橋樑。(其實還有一點可以改進，統計物理里更深入的Ising model是考慮了粒子與相鄰粒子之間的local自旋相互作用來進行一階修正，在金融市場裡面參與者和參與者之間沒準也可以考慮這種修正使得BS model更加精確呢，當然這已經算是凝聚態物理比較前沿的研究方向了，局限在local的條件也不一定適應金融市場)

作為類比，金融市場也可以分成宏觀系統和微觀個體，通過類似物理的熱力學統計這一套東西把金融裡面微觀宏觀統一起來描述整個系統，其實就是布朗運動。在金融市場裡面我們可以想像成股票價格在不計其數的人的合力影響下的運動。即使市場參與者的數目相對水分子少很多，但是數量依然非常龐大，而且還加入了人是否理性行為的不確定性(可以想像成測不準原理)，我們也不可能完全掌握這個市場上每個參與者的信息，也就不能準確預測股票未來的價格。

通過這個對比我們可以感覺到這兩個過程確實很類似，並且可以利用物理上的這個過程和其解來描述市場的運動還很有效，確實是一個非常神奇的事情。其實我一直在試圖將自己對物理的理解和金融的理解結合起來，發現除了熱力學系統的布朗運動和相變應用在金融市場，這樣fundamentally類似的真是不多。似乎物理在機器學習和深度學習上面倒可以看到很多類似的東西，比如Restricted Boltzmann Machine(RBM)就參考了玻爾茲曼分布的partition function，神經網路hidden layer有效的理論證明也參考了統計物理裡面描述spin系統相互作用的Ising Model和量子場論里的重整化群(https://arxiv.org/abs/1410.3831)。物理更本質的是量子力學量子場論群論粒子物理，也許借鑒一下未來會搞出來更底層的金融版本也說不準，但是也可能這種聯繫本來就不存在，不可強求。

這裡我們可以看到布朗運動來描述市場這個系統是可行的，所以就有了下面這個方程：

這裡方程左邊的S是股價。右邊呢，第二項W就是布朗運動，或者也叫做Wiener process。這個W前面還有兩個因子，一個是sigma，也就是波動率；另一個是S，也就是股價。

先來介紹一下為什麼有S，

因為這裡並不是假設價格直接是布朗運動，而是價格S的log函數是布朗運動(換句話說就是股價服從的是lognormal分布)。

我們把方程兩邊都除以S就可以看到左邊的dS變成了d(logS)，右邊變成了mu*dt+sigma*dW，所以可以看到是logS服從布朗運動。

(其實這個地方很不嚴謹，因為S包含了布朗運動的信息其實是一個不可導的函數，我們不能直接把S當除數，但這個有一個比較intuitive的sense，下面講到Ito』s lemma的時候會再介紹)

那可能又會有同學問，為什麼是log函數呢？

因為我們假設的其實並不是股價本身的漲跌絕對值是布朗分布，而是相對前一天的漲跌百分比。對於log函數來說，如果現在股價是X1，明天估計是X2，那麼漲跌的百分比 logX2-logX1 = log(X2/X1)，一階展開之後其實也就約等於X2/X1。所以其實平時我們簡單用log來看收益率其實是也隱含用了這樣一個近似的假設。另一個更數學的理解的辦法其實就是從離散過程通過無窮小量轉換成連續過程，比如讓T/n，再讓n趨於無窮大求極限也同樣可以得到這個log函數(這一點其實很重要，因為後面我們會遇到riskless rate的discount因子，說白了其實就是無窮小的時間間距來算複利)。

再來介紹一下為什麼會有波動率這一項，這裡就需要介紹一下random walk和布朗運動了。

random walk的內容簡單來說其實就是每秒擲一次硬幣。正面贏1塊，反面輸1塊，然後比如扔一天看最後自己贏了多少錢。

因為這是整個期權定價的基礎(說白了可以把股票每秒漲跌當做扔正反..)，所以這也是為什麼quant面試的時候經常喜歡把各種各樣的硬幣翻來覆去扔來扔去，你們這些人有考慮過硬幣的感受么！

當然啦，random walk並不能幫我們預測漲跌，我們更看重的是random walk的數學性質。

上面列出來有3個性質，

第一個是每次扔硬幣收益的期望為0，這其實也就不小心暗示了從random walk推導出來的期權其實是建立在扔硬幣的假設上，也就是傳說中的市場有效假設，或者risk neutral measure。

第二個是每次扔硬幣是independent，也就是扔了10次反也不一定就代表下一次可以扔出一個正(但每次炒股一直虧的時候卻總想著能一次翻本? )，每次正負的概率都還是0.5，不以人的意志為轉移。

最後一個是stationary，也就是我先扔10次的過程，跟第二輪投10次過程的概率分布沒有任何區別。

從這個地方我們也可以看出來每一次扔硬幣其實是類似一個Bernoulli過程(Bernoulli的outcome是1和0，我這裡為了跟市場做直觀的對比所以用的1和-1，犧牲了嚴謹性需要注意)，要麼正要麼反，要麼贏要麼輸。根據統計知識我們就可以知道，玩這個遊戲賺的錢總數的分布呢是類似Binomial的。

從Binomial的名字就可以看出來，這是一個離散的過程，而且我們可以引入二叉樹的方式來推導期權定價公式。但是作為一個物理直男我還是對連續光滑柔軟的東西比較感興趣，所以這裡只推薦一下書，想真正弄懂的同學可以去看看Steven E.Shreve的Stochastic Calculus for Finance 1:The Binomial Asset Pricing Model，算是很經典的教材了。(對，所以我也沒看，而且我也知道你們肯定也會mark再看，然後想必也就是永別了...)

也附上我自己稍微寫的推導過程，

1.5 Brownian Motion

好了，我們繼續。

上面介紹完了離散的Random Walk，同樣統計告訴我們Binomial分布有一個性質，那就是當n非常大的時候，也就是當我們玩的次數足夠多玩到天崩地裂地老天荒的時候(這硬幣可以玩一年)，我們賺的錢的分布就變成了一個normal distribution。

(這也是為什麼我們經常默認把收益率當做一個normal distribution，因為本質上是近似成了布朗運動，這一點是平時非常容易忽略的。但實際上大家也知道市場並非真的normal distribution，而是有各種skew和inefficiency，第二部分會詳細討論)

這其實就是從離散過程到連續過程，也就是把上一節中的二叉樹定價延伸到無數subtree就收斂到了接下來布朗運動推導的BS方程。

布朗運動就厲害了，random walk是離散的每秒扔一次，而連續時間的布朗運動可以當做每秒扔一千次一萬次一億次一直到無窮大，然後扔一天看自己贏了多少錢，沒準就完成了一堆小目標，虧掉幾個億。

這裡我們也同樣可以得到類似random walk的布朗運動的3條性質(上圖中Theorem 2.1)，

第一項跟random walk一樣，期望還是0，說明市場有效理論的假設依然保留。

但第三項的independent就有點不一樣了，這裡限制似乎更強了，還需要在時間上不overlap。

再看第二項的stationary，這裡給的信息也更多了，不再是單純的說相同時間間隔的分布一樣，還告訴我們說這個分布的具體形式就是正態分布，這其實也是中心極限定理的推論。

有了正態分布其實也就具備了數學上的操作性，有了期望有了方差，從此我們就可以用實實在在的公式來model期權的價格了。

至於為什麼布朗運動是正態分布，我們可以看看愛因斯坦老人家是怎麼通過熱力學解出來的:

其實愛因斯坦已經轉化成熱力學的擴散方程把期權的價格給解出來了...

這個正態分布呢有一個很特別的地方，那就是它的variance是t，也就是這段扔硬幣的時間間隔。其實也非常make sense，當扔硬幣頻率一定的時候，扔的時間越長自然我們得到收益的方差就越大。具體為什麼是t，也可以參考上面愛因斯坦的結果里算出來的方差。

回到剛剛的式子，希望你們還沒有忘卻我們在幹什麼。

這裡應該就可以理解為什麼上面寫了standard deviation是sqrt(t)了。

我們講完了布朗運動，可以看到W前面有一個波動率sigma的係數。比較直觀的理解就是布朗運動或者random walk是每次賭1塊錢，但是我們股價可以每次賭2塊呀，這樣我們就需要在前面乘上2這個係數，也就是這裡的波動率了(畢竟波動率是用來描述單位時間內股價的變化方差)。

這就是整體這個式子的第二項了。

那第一項又是什麼呢？第一項是正的drift。

為了易於理解，我們可以看看下面的圖

還有一張從《選擇與未來》裡面截屏下來的，

其實看完這兩張圖就很明顯了，由於經濟和科技發展長期來看是會一直向上的，所以股價其實也是有一個向上的平均趨勢，也就是那個正的drift。如果沒有這個趨勢的話就會像《選擇與未來》那張圖裡面沒有drift的Wiener process的情況，長期的期望值是0，也就是單純的布朗運動了(如果是這樣就慘了，說明市場真的變成扔硬幣了)。

好了，我們現在也介紹完了股價和布朗運動還有drift的關係，接下來我們就需要開始用這個最fundamental的model來推導針這個股價的期權的定價。

1.6 Stochastic Calculus

在解出期權的解析解之前，我們需要一個工具來幫助我們handle雖然連續但是卻處處不可導的布朗運動，這就是Ito』s lemma。

Ito』s lemma其實也就是像愛因斯坦推導過程當中用到的Taylor expansion，只不過Ito』s lemma是同時對股價S和時間t做泰勒展開，時間t是一階導，股價S是展開到二階導(這麼做的目的是因為股價裡面含有布朗運動的信息，所以我們需要S^2這一項來導出布朗運動)。

先給出Wiki上面的解釋(符號需要注意一下，這裡dB就是布朗運動，和之前的dW可以看做一個東西，這兩個符號在不同的教材都代表Wiener Porcess和布朗運動)，

這裡第一個式子，就是我們之前構建出來的布朗運動的股價表達式(如下)。

從第二個式子開始一直到最後就是Ito』s lemma了。

但是第一次看到這個式子可能會有疑問，

這是在幹嘛？為什麼跑出來一個f(t,x)方程呢？

這裡f(t,x)可以想像成期權的價格，其中的t就是時間，x就是股價Xt，所以期權是看做時間t和股價x的一個函數(也非常make sense)，然後我們的任務就是解出來這個偏微分方程得到期權價格f(t,x)的解。

而從第一個式子和前面的解釋我們知道股價Xt是包含了兩項，隨著時間drift的這一項和布朗運動dB的這一項。第一項沒有什麼問題，本身就是時間的一階偏導，問題在於第二項怎麼去處理布朗運動dW這個東西。

最大的問題就是布朗運動dB是連續但不可導的，我們沒有一個光滑的函數來描述布朗運動讓我們盡情玩耍，這也是stochastic process和其他偏微分方程最主要的區別，所以我們無法對其直接求偏導來得到解析解。而Ito』s lemma就給我們提供了這樣一個橋樑，把布朗運動dB當做了一個整體而聰明的避免了不能直接求導的問題。並且利用上了前面我們解釋布朗運動時候的一個性質，那就是布朗運動dB的standard deviation是sqrt(t)，所以在推導的過程中出現了dB^2這一項就可以直接變成了易於處理的dt。

所以wiki裡面將第一個式子和Ito』s lemma結合起來，就得到了最後那個式子，也就是期權價格的微分方程。稍微提一下，這裡求解這個偏微分方程其實可以溯源到量子力學裡面的Feynman-Kac equation，或者含時薛定諤方程，這裡f(t,x)其實就是波函數。我猜這種驚人的相似也是當初做Q quant的大部分是物理phd的原因了，甚至更fundamental的原因是同屬於場論範疇，一個是金融的BS場，一個是波函數概率場。

詳細的也可以見我的草稿，

這裡有一個小trick需要提一下，那就是f(t,x)不僅僅可以是期權價格，其實可以是任意自己感興趣的方程形式。當我們把f(t,x)直接設置成為log(x)這個形式的時候就出現了神奇的一幕，我們直接解出來股價x的表達式了！(這個表達式其實特別像lognormal分布的mean的期望)

還要啥期權，股價都可以預測了，感覺馬上就要成為人生贏家還有點小激動呢~

但是！我們忽略了表達式裡面依然還有布朗運動dB這一項。只要方程裡面存在這一項我們就不能得到真正的解析解，所以這一條路走不通，我們需要換一種方法，藉助另外一個式子來消除掉布朗運動dB。問題是應該怎麼做呢？

這裡就和金融市場聯繫起來了，無套利資產定價。這裡並非一般均衡那樣從供給和需求的信息就從無到有給出定價，而是基於一些已知的資產價格把其他的資產價格定下來，也就是replication portfolio(如下圖)。具體思路是利用已知價格的資產股票和衍生品組成一個portfolio，然後通過選擇組合權重，使得整個portfolio無風險，繼而讓其payoff等同於無風險利率，來找到衍生品的合理定價也就是BS方程。這個方法在金融裡面其實也非常常見，比如在CAPM裡面，還有在二叉樹定價裡面都有用到。

這裡我們構建一個期權和股票的portfolio叫做 $Pi$ ，並且需要這個portfolio不隨著股價變化而變化(delta hedged)，其實也就是使其完全的無風險。這裡我們假設這個portfolio裡面有一份期權，還有delta份的股票(這裡detla的值暫時是不定的，下面會求出來正好就是前面greeks部分的那個delta)，也就是 $Pi$ = f - delta * S，然後下面我們就來看怎麼運用portfolio無風險的特性來得到期權的解析解。

為了看得更清楚股價對於我們portfolio的影響，我們對兩邊偏微分，得到d $Pi$ = df - delta * dS。

我們分別代入前面Ito』s lemma得到的期權 f(t,S) 的方程式還有更前面股價S的式子(我圖裡面寫的不太嚴謹，S因為含有布朗運動這一項所以不能放在分母)，這樣就得到圖中的了(1)式。並且我們讓這個portfolio的表達式中的布朗運動dW這一項前面的係數為0，所以這裡delta=df/ds，大家可以發現這裡的delta就是前面講期權greeks時候的那個delta，並且hedge確實就是發生在這個地方，這也是期權最有魅力的一塊兒地方。

並且我們知道這樣一個完全獨立於股價的portfolio在完全有效市場的假說下，其收益率只能是等於無風險收益率，比如國債利率。所以我們就得到了圖中的(2)式，π自身的凈資金量乘上無風險利率就應該等於其整個portfolio隨相應利率時間段的變化。

接著，我們把(1)和(2)結合起來，就得到了BS方程。這裡我們可以看到，布朗運動的dW這一項已經在令delta=df/dS那兒給消除掉了，所以最終的BS方程裡面就不在有布朗運動這一個我們一直想要擺脫的隨機項。這裡，就回到了最開始1.1中的的Black Shores方程，完成了天地間和諧的大圓滿。

這裡還有一點很有意思，就是這裡的BS方程里一開始股價S方程裡面的那個drift項mu不見了，或者說mu值並不影響期權的價格。

追溯回去其實就可以發現，把drift項變不見的那一步就是在做delta hedging的地方，使得delta=df/ds就把drift給抵消掉了。這其實也蘊藏了一個很重要的信息，那就是在有效市場沒有套利的前提下，drift項就直接退化成了無風險利率r嵌入在了期權的定價中。

或者從風險中性的角度解釋，mu可以看做人們對未來資產價格的預期或者風險偏好，而這種預期或者偏好已經反映在了當下的價格之中，我們又是把當下價格作為已知條件，所以整個風險中性並非沒有考慮人們的預期或者風險偏好，而是這一塊兒的信息已經通過當下價格這個input被考慮了進來，所以站在當下的價格來看這種預期並不會影響期權的價格。自然，在風險中性概率下，也就是剔除掉未來預期對未來價格的影響之後，這就是為什麼drift項mu會退化成無風險利率r，所有資產價格都是用無風險利率把未來的payoff折現到當下，也是risk neutral measure的核心。這個trick簡直滿分，因為我曾經思考過很久用什麼方法去估計主觀預期對價格的影響，這裡直接當做input就給加進來了。

當然，如果有對物理方法解微分方程感興趣的變態盆友，也可以享受一下我奔放的字跡。

從物理的熱力學擴散方程或者薛定諤方程出發呢，用傅里葉變換來解這個微分方程會方便得多。

1.7 Markov Process and Martingale

面前為了一口氣把BS方程整個流程給敘述完，所以省略了Markov Process和Martingale這兩個概念，現在補上(在quant面試中也經常會考基於他們的概率brain teaser，但其實隱含的是對期權的理解)。這兩個性質雖然對於BS推導其實並不是直接相關，但是其實是已經隱含在random walk和布朗運動這個假設前提裡面，對於理解概率和隨機過程非常重要。

大家很喜歡用random walk或者布朗運動來做model的基礎，其實一定程度上就是因為他們都同時滿足Markov Process和Martingale這兩個性質，在數學上面使用起來舒服極了，就像物理裡面假設的"真空球形雞"。

Markov Process

首先先介紹一下Markov Property，如下:

這裡說的最主要的一個性質就是事情的下一步發生概率僅僅和當下的狀態有關(統計的語言就是condition on當下的狀態)，和更前面的經歷沒有任何關係，每一個單位過程都是獨立的事件，或者說沒有記憶性(有記憶性的model比如說比較火的LSTM)。直觀的理解可以想像一維上下random walk的運動，下一步的位置僅僅和當下的位置有關；或者更直觀一點還有拋硬幣，當下拋出正還是反並不依賴於前一次是正還是反。所以這是random walk和布朗運動這一類隨機過程很重要的一個性質。並且我們可以從中隱隱嗅到到一絲有效市場的味道，下一個單位過程的狀態僅僅和當下的狀態有關，即所有的歷史信息已經反映包含在了當下的價格裡面(一種特殊情況下的time series，ARIMA(1,1,0)，當然，是一種理想情況)。

還有一個東西就是transition matrix(這裡假設其不隨時間而變化)，用來概括每一個單位過程所有可能的狀態i到所有可能的狀態j的概率(這個矩陣不一定是角對稱的，或者用圖論的說法就是並不一定是undirected graph)，如下

直觀一點解釋，還是拿拋硬幣來作為例子。每一次拋硬幣只有正反兩個狀態(i,j~{A,B})，並且概率都是0.5(假設硬幣是unbiased)，這個矩陣可以用下圖表示，從一個狀態到另一個狀態的幾率都是0.5。

而上面wiki公式里的P矩陣其實就是更general的形式，代表這一刻可能的所有狀態i和下一刻的所有可能狀態j的一個概率圖(這裡不再是只有正反兩個狀態，而可以有很多種狀態)，並且每一個i到j都用一個概率大小來描述。這樣一個transition matrix就包含了這個系統所有未來演化的信息。

舉一個具體的金融市場的例子(摘自wiki)，

這裡把市場看做三種可能的狀態(bull, bear, stagnant)，並且假設我們知道他們之間這個transition matrix(當然，現實中這個matrix並不是恆定的，這裡只是一個簡化的模型)。然後給定了初始狀態之後，我們可以知道在若干個單位時間後處於每個可能狀態的概率。這裡其實已經可以看出來二叉樹定價其實只是這裡很特殊的一種情況。

也許有童鞋會接著問，如果這裡我們取無限大的單位時間也就是無數個這個矩陣相乘，那麼最終系統是不是會converge到一個穩定的狀態？對，因為平穩條件的物理含義就是對於任何兩個狀態i和j，如果從i轉移出去到j而丟失的概率恰好會被從j轉移回i的概率補充回來，那麼狀態i上的概率是穩定的，其實也是一個求極限，如果矩陣是收斂的那麼就表明這個系統最終會穩定在某一個狀態，如下，

有一點需要注意，上面說的是系統隨著我們想要知道的特定時間跨度的演化過程，並且狀態之間是可以互相轉化的可以一直演化下去的開放系統(穩定平衡的系統，而不是嚴格的stop直接停止了演化)。

有一種特殊情況是會直接stop，就是當這個matrix裡面的某個狀態在下一個單位時間變成自己的概率是1(對角線上的概率)的時候，或者換句話說一旦落入這個狀態是不可能再跳去其他狀態，也就是整個系統的演化停止了。這種概率為1的狀態是屬於aperiodic，一些有明確stopping rule的系統就屬於這種類型，比如賭博的贏和輸，我們就可以根據矩陣算出來這個系統在給定具體stopping目標(這個目標其實就是上面的某個狀態)後這個目標的發生概率，比如明確定義什麼是贏和輸之後可以算出來某個起始狀態一直演化到終止狀態(一定要明確定義至少贏和輸兩個stopping criteria這種問題才有意義，不然經過足夠的時間一定會落在那個唯一一個概率為1的狀態)的概率，這裡終止狀態就是只能永遠被trap在自己狀態的"absorbing state"。除了計算贏和輸的概率，我們還可以得到贏或者輸所需要的expected單位時間的次數。這兩塊兒的概率題(比如gambler』s ruin problem，哪兒都可以看到這貨...)也是quant挺喜歡考的。

我一直感覺Markov Process和量子力學有某種內在聯繫，因為量子力學天生就是隨機過程並且滿足Markov Property的沒有記憶性，核心也是用波函數表示的狀態的轉移概率，density matrix就類似於這裡的transition matrix，並且把每個狀態函數當做系統的basis或者eigenvector，只不過在這個上面加上了觀察會使系統的概率矩陣坍塌，或者說會改變transition matrix本身這樣一個性質。當然Markov Process可能用來描述宏觀的牛頓力學似乎更加合理，畢竟狀態的transition matrix是deterministic的。

Markov Process其實不僅僅是在隨機過程中比較重要，就算是在機器學習和深度學習中也是很重要的一部分，代表了部分隨機部分可由決策者控制的狀態下的決策優化過程，比如現在比較火的reinforcement模型。刷過Leetcode的可能也會發現Markov Process和graph theory還有Dynamic Programming非常類似，事實上Markov Process就可以用DP來求解，畢竟DP本質上也是從一個狀態轉到下一個狀態並且遍歷所有的狀態來達到自己的target。還有統計中的Markov Chain Monte Carlo(MCMC)，Monte Carlo是一種simulation的方法，以前曼哈頓計劃的時候馮諾依曼費米費曼Metropolis等人為了模擬原子彈搞出來的，在期權定價的時候可以利用來simulate二叉樹的path和BS方程的解析解來求期望得到定價。但是這是理想情況有解析解的定價，現實中很多pdf也並不能直接通過uniform分布one-to-one的analytical inverse transformation得到，而我們又想要產生從這個pdf出來的random variable，與平穩收斂的Markov Chain結合起來之後有更加強大的功能，這個時候就可以用MCMC這種indirect的sampling方法，自然也可以解決沒有closed-form解析解的期權定價問題，我猜估計是importance sampling通過MCMC來產生想要的pdf，最後求期望得到價格。(完全不相干領域的東西竟然可以串起來的感覺真神奇)

網上也看到一句話總結Markov Process非常勵志: "忘掉過去，把握現在，展望未來！"

Martingale

Martingale是一個什麼東西呢，中文翻譯成鞅(簡直」信達雅"，人生第一次看了翻譯發現更不懂了…就是為什麼我一直很抵觸強行翻譯的專業辭彙)。基於前面的基礎知識其實可以精鍊成一句話描述，"martingale就是drift為0的隨機過程"。其代表的是博弈論中的公平博弈的數學模型，這裡的公平博弈其實也可以看作是市場的risk neutral measure。

Martingale的起源貌似是一種賭博方法(追根溯源把金融市場看做隨機的賭場其實並沒有什麼毛病)，

對於martingale這個加倍賭注法我並不完全否定，很多文章都千篇一律歸咎為這是賭徒謬誤，因為每次的實驗都是獨立的，不能拿系統實際的發生概率來指導下一次的實驗結果。還有的就是說對大數定理的誤解，隨機發生的次數足夠多的時候發生的頻率不一定會趨近預期的概率。說的都很學術看起來很有說服力，但我覺得其實都沒有說到點子上。這個策略最大的問題其實是風險和收益不成正比(sharpe ratio太低)，虧起來可以虧很多但是即使最後贏了也只能賺一塊錢。

我這裡可以改進一下這個理想實驗，假設是馬雲作為賭場的對手方，賭上了阿里巴巴all in，並且更瘋狂一點每次加三倍讓預期的收益足夠吸引人，這樣其實就挺賺的，雖然風險更大了，但是收益直接變成了50%而不再是一塊錢。況且如果是兩個甚至更多個馬雲一起作為賭場的對手方玩這個遊戲，那賭場的風險反而才是最大的。甚至都不需要馬雲，直接從網路上即時全球眾籌這樣一個瘋狂的策略，資金源源不斷補充保證我們對賭場有絕對的資金優勢，穩贏50%收益我覺得還是很有吸引力的。再接著開一個腦洞，用這個辦法從全球資金量最小的賭場開始吃，依次按照順序把全球的賭場資金都可以吃掉了。事實上這樣一個瘋狂的策略是可行的，但賭場也不傻，遇到概率期望不佔優肯定就會改規則，所以現在都會通過限制最大賭注來控制這種風險，而並不是像很多文章那樣信誓旦旦人云亦云讓賭徒謬誤背鍋。

扯遠了，霸王硬收回來。martingale的定義如下，

用直觀的語言敘述就是，符合martingale過程的變數X的未來期望值就是當下的值(這個過程的初始值)。或者說站在當下做很多次重複隨機試驗，X值的分布會center在當下的值。其實也就是說這是一個fair的game，只會回歸均值(無風險收益)而沒有超額收益，這是BS方程里的一個很強的假設。之前一個小節講過風險中性的假設下對資產的預期或者偏好已經反映在了當下的價格之中，而當下的價格又被用作input去推導未來的收益期望，所以實質上當下的信息已經可以代表未來的期望，也就是martingale的性質了。

還是拿random walk舉例，假如站在原點0，然後隨機上下走1000步，Y軸是Y=X1+X2+···代表當下的位置，X軸就是時間n。並且這個實驗做100次(100條線)，那麼會產生如下的圖，

我們可以明顯看到Y所有的分布合起來的mean基本上在0。並且標準差或者說一個sigma的值就是n(當然這個性質不屬於martingale)，也就是時間單位的長度，這裡其實是對前面提到的布朗運動第二條性質正態分布的一個simulation。

所以對於符合martingale的隨機過程最主要的特徵就是分布會center在初始值，或者說沒有drift。

我們可以想像一下假如市場是一個單純的martingale過程，那就變成了賭場拋硬幣一樣完全的零和博弈(交易所就是賭場，參與者就是賭徒)，無論未來時間有多長和會發生什麼，其mean的期望都是在起始點0(如果加上手續費，甚至是負值)。這是一種怎樣的無力感。幸運的是，BS model裡面除了martingale這一項(布朗運動)之外還加入了一個正的drift，至少還是有增長的。

對於特殊的random walk的位置變數Y而言，有一個很有用的martingale的推論。那就是除了Y本身是martingale，Y^2-n也是屬於martingale。

當然，martingale對我們還有別的用處，那就是可以幫助我們解決optimal stopping problem。

舉一個很常見的面試題，drunk man。內容就是一個痴漢，不，是醉漢，在橋上random walk，和兩個對岸的距離分別是a和b，問醉漢去兩邊分別的概率是多少。其實直覺的想就是a/(a+b)和b/(a+b)，答案是對的，但其實這個推導並沒有這麼顯然，需要同時聯立Y本身是martingale，Y^2-n也是屬於martingale這兩個方程。除此之外還可以求出來達到某一個對岸的步數的期望。

這個問題其實也可以用Markov Chain來解決，畢竟random walk也符合Markov Chain，每一步都是可能的狀態所以都可以列一個方程然後得到結果，並且stopping time的boundary其實就當於前面介紹的Markov Chain里的absorbing state。所以其實只要是本質是random walk的問題這兩種方式都可以求解。stopping time的問題本質上也可以用Dynamic Programming解決，因為DP的boundary其實本質上和Markov Chain的absorbing state也是等價的，DP裡面遍歷的的每一種可能性其實就是Markov Chain的transition matrix里的每一個狀態。

類似，martingale的stopping time其實是對期權很重要的一個問題。因為我們需要隨時給期權定價，而價值本身就是決定於給定stopping time行權時候收益的期望值，而martingale性質可以幫助我們計算達到特定stopping time的概率，繼而幫助我們計算這個隨機過程的收益期望值。當然實際還需要考慮無風險利率drift這一項，為了保持同樣的計算過程就需要想辦法構造一個martingale，其實也就是多加上exponential這一折現因子在股票價格上使得整體變成martingale，additionally把未來的價值根據無風險利率折現成現在的價值，可能聽起來是懵逼的，具體可以看下面我的推導。

什麼，看不懂？

對於martingale和風險中性還有change of Numeraire什麼的，我感覺是有一點用Jacobian變換空間坐標系的feel。

還有很多其他相關的東西，就涉及更數學的measure theory知識，懂的自然懂，不懂的我也講不懂，因為我也沒學過。

對於期權，我們的假設前提是布朗運動。而對於連續的布朗運動，再補上另外一個martingale的性質，也就是exponential形式的martingale。

下面是一個期權定價的例子，

好了，把這一塊兒稍微總結一下。

我們需要注意的是Markov Property和Martingale並不是一個東西，他們是完全獨立的兩種性質。但是這兩種性質在數學的處理上來說都非常方便，所以同時具備他們的過程就是理想的研究對象，比如離散過程就是random walk，連續過程就是布朗運動。然後建立在這些理想數學模型上的資產價格，就可以直接用這些model的數學推論來研究了。

將市場比作布朗運動也正是因為它同時包含了這兩種最關鍵的特性，

一種是martingale，表示未來收益率分布會center在當下(更準確一點是期望值center在drift這條線，然後上下隨機波動的分布是一個mean在0而variance是時間t的高斯分布。其實也有一點周期的意思，只不過這裡直接假設超長跨度中的周期被average成了一條斜率為drift的線性直線)，市場是一個fair game不存在超額收益，風險中性risk neutral；

另一種是Markov Chain，表示了歷史的信息全部已經反映在了當下價格中的有效市場，並且腦洞大一點，如果存在這樣一個matrix那麼可以推導出未來所有可能狀態的概率。

乍一看似乎是衝突的，說是隨機過程完全不可預測，怎麼又變成可以預測了呢。這裡其實和量子力學很類似，我們說的不可預測是不知道未來會處於哪一個狀態，而不是對於每一個狀態的不可知論。簡單來說我們知道貓有死和活兩種狀態，並且知道概率都是0.5，但是沒有觀察我們並不知道它到底是死還是活(當然我知道這也是對量子力學最詬病的一點，聽起來似乎有點詭辯，更神奇的是這種詭辯在實驗上是可以驗證的，光子連續通過不同角度的偏振片就可以驗證這種不確定性就是量子力學內秉的性質)。同理理解金融市場，只有未來的事情發生之後我們才能知道到底是哪個狀態，但是這個時候機會已經過去。聽起來很像廢話有沒有用，但是這個就是理解的最本質的東西，未來具體會是哪種狀態是不可預測的。但是假如我們可以通過某種方式(比如利用martingale來做mean reversion，或者利用markov chain的transition matrix)知道可能狀態的概率是多少，從而利用這種概率上的優勢來做出基於大量交易次數基礎上的」穩定"策略。

好了，整個BS model的推倒過程就結束了。這裡僅僅是站在物理phd的角度上介紹了我自學BS方程的總結和一些聯想，希望能提供給大家一些有啟發的intuition，基於BS之上還有非常多不同的改進和定價方式可以去研究，在此也不一一介紹了。

接下來呢就進入第二部分，我的扯淡時間。

2.我們為什麼能賺錢

接觸金融已經三年多，一開始的興奮早已過去，現在反而開始懷疑自己之前對市場的理解。

我把這個問題放在這兒是因為上面我們講到了BS model是將市場比作random walk或者布朗運動，這個在我來看是真的非常有insight的，可能算是我從接觸金融以來最改變我對金融市場理解的一個idea了。

但這個就會引出一個eternal deep的問題: 我們為什麼能從市場賺錢？

這個問題其實是我在面試的時候遇到的一個問題，前面BS model部分其實都還OK，突然對方話鋒一轉，當時我就懵逼了。後來我發現這個問題確實很有價值，也心服口服，在這裡正好基於自己對市場的理解稍微總結一下。

如果沒有想過這個問題，那麼勸你早點退出市場，等想清楚了再參與。因為不知道自己是怎麼賺/虧的錢是一件非常危險的事情，風險沒有bound。

之前也詳細描述了市場和布朗運動的相似，那麼就說明我們所有在市場上試圖去預測每分每秒漲跌的行為很大程度上都是徒勞，因為這就像我們試圖去預測準確花粉每一秒的運動軌跡一樣。比如扔10次硬幣，1000個人扔總有幾個幸運兒可以全部扔正面。這無關預測能力強弱，這是概率的保證，或者說just end up on the lucky side of the distribution。

我並非不可知論者，但這種對市場的預測本質上是一個隨機過程，我們是試圖在未來的隨機性裡面找穩定的確定性，which is not fighting against people, but against statistics。

可能讀到這裡會覺得有種憂桑無力的感覺油然而生，就像學了物理一樣。

那我們是不是就應該放棄治療呢？

Good news就是市場其實並不是完全和花粉一模一樣的布朗運動，這也是我依然相信市場上還會存在alpha的原因。布朗運動的確是一個從本質上來講都很好的近似，而且還可以通過數學的方式去描述整個系統，從無到有擁有這個工具已經是金融領域一個非常巨大的進步。但是，既然是近似就有其過於簡化的地方。比如說布朗運動其實是每個水分子是完全相同並且權重一模一樣的系統，但是市場上面明顯不是每個參與者的影響力都一模一樣。比如如果能熟悉大權重參與者他們的行為動機還有體制和倉位的限制，其實是有機會做一些front run來盈利的。我所知道的市場上比較大的參與者就是各國央行，國家主權基金，養老金/Medicare，大型銀行和保險機構等等。下面上幾張圖感受一下:

之前跟盆友們聊起來保險行業才大吃一驚，原來他們持倉這麼多的債券。這裡大概介紹一下duration matching，這就是關於理解他們動機一個很重要的途徑：

大概意思就是保險和養老金需要買國債去match久期，因為保險公司或者養老金其實可以算是負債，比如說保險，他們賣出保單，實際上是未來返還現金，所以為了避免受到利率波動的影響，他們的資產的久期需要match上負債的久期。但我一直不太確定的地方就是，到底保險和銀行占的比例有多大，現在發現保險的持倉跟fed是同一個量級。聯儲最高的時候也就2500Billion，保險基本上也是這個數目。感覺做壽險簡直就是債券的交易員了...銀行和保險應該算是長期優質債券的大買家了，畢竟周期都比較長，對負債的duration match還是蠻重要的。對保險公司來說我覺得可能國家行業政策上會有一些restriction，就像對銀行也有壓力測試一樣，也會對風險敞口啥的會有一些要求，可能就得包括duration match的部分。但這兩類公司對債券市場短期似乎衝擊都不太大，調倉的周期長也比較慢，基本上都是保持在穩定的範圍內。唯一需要調整的可能就是根據資產和負債的結構進行調整，比如還有持倉股票啥的，股票一直漲的話是得賣掉一定股票去買國債來從短端移到長端來match duration，如果再加上衍生品的投資項目可能就會更複雜一點，但總體來說債券還是最大的持倉，其他都是微調。

當然這只是一個例子，還有很多很多東西都需要去了解，甚至很多東西都不是擺在檯面上的，這個就是需要依靠行業經驗了，比如fund的window dressing，比如年底機構由於稅收問題需要調倉etc，比如宏觀上的carry(對這一塊兒感興趣的可以關注清算銀行BIS的paper，裡面還是挺多都在講macro trading，也很有意思).

回歸正題，我現在的理解是，市場是一個近似的布朗運動或者隨機過程，用一個詞來描述就是effectively inefficient。這也是我最近看的一本書的名字，我覺得還是很貼切的。

引用一個笑話，「一位經濟學教授和他的學生走在大街上。突然，學生指著地上的一張10塊錢票子對教授說:「老師，地上有10塊錢。」聽見了學生的話，老師卻頭也不回地說:「那不可能。如果有的話早就被別人撿走了。」

如果每個人都這麼想，那麼這10塊錢永遠不會被撿走。

同理，這個市場很有效，但是又不是那麼有效。

站在不同的立場可能對這個問題會有不同的偏好。比如賣方或者market maker或者Q quant就會天生假設市場是有效的，不然自己建立在有效市場假說上構建的工具和對於counterparty risk的計算都是不對的。但站在買方或者P quant的角度，會更傾向於認為這個市場是不有效的，畢竟自己的收益來源就是找到這種inefficiency並從中獲利。所以這種effectively inefficient同時養活了P quant和Q quant，各取所需，缺少了任何一方估計都維持不了這樣一個穩定的生態平衡。

我暫時能想到的能在市場上賺錢有三個原因:

(1) BS model裡面有一個drift項，這個可以看做benchmark大盤的平均收益，或者說整個社會的經濟增長。

(2) 賣方，基於理想model對於市場風險的模擬好壞，決定了自己工具準確定價的有效性，也決定了自己能賺多少手續費。

(3) 買方，我們找到了市場上的inefficiency/pattern/logic/mis-pricing等等，甚至BS這一類理想efficient的model可以反過來幫助我們anomaly detection獲得收益。無論這些inefficiency/pattern/logic/mis-pricing是來自於宏觀，行業，公司還是純technical trading，只要有效，這些都可以是自己的edge。而期權衍生品只是幫助我們實現這種inefficiency的一種比較靈活的工具，除此之外其他任何形式的工具都可以，要麼速度比別人快可以優先套利，要麼比別人聰明找到了沒有被發現的inefficiency，要麼就是騙人了。

而並不是由於預測能力好壞來決定我們是不是能賺錢。如果是以預測大盤每天漲跌，幾乎不可能跑贏大盤，而且很大可能在一次的失誤裡面失去所有的籌碼。而且即使自己的判斷是對的，時間不對也會被市場掃出局。

知道自己怎麼想很重要，知道其他人怎麼想更重要。有一句話叫做市場永遠都是對的，能不能賺錢不僅決定於自己是不是真的正確，也取決於其他的參與者的行為。

我們如果想要清醒的在市場上生存下來，一定需要了解我們收益的來源是什麼，不然我們無法主動管理風險。

要麼我們是long only買買買，這樣我們的收益來源是跟隨市場的beta，承受市場的系統性風險。

要麼是我們可以利用某些方法幫助我們找到市場上的inefficiency/pattern/logic/mis-pricing任何一種alpha，並且在失效之前take the most advantage of it。引用G神的一句話非常有既視感一起感受一下，」一旦超過2個sigma，全世界的daytrade和algo都online了」。還有一點也需要注意，我覺得也非常有insight，也許可以讓大家在trading上面少走好幾年彎路，如果找到了一種inefficiency，賺的太多也是一個嚴重的問題。因為你賺的錢肯定是從別人的口袋裡拿出來的，在明確知道自己的edge和賺的是誰的錢之後你賺太多會使市場inbalance，並且只有兩個結果，要麼別人因為虧太多而出局了，要麼別人意識到改變了策略。Either way，這種inefficiency都會消失，你也再也賺不到這部分錢。太貪婪其實是在加速使策略decay。

了解我們受益的來源的重要性還在於，我們可以知道什麼時候應該捨棄這個strategy。

千萬不要小看這一點，之前困擾過我很長時間，自認為量化裡面很難解決的一個問題就是regime switch。這其實並不只是一個技術問題，而是一個自洽的邏輯問題。

從來沒有一直有效的策略，每個strategy都有自己應用的環境，如果一旦環境變了那麼strategy很可能也就失效。regime switch具體的內容就是很多時候如果strategy的performance不好，我們並不知道是真的環境變了到之後strategy不work了還是僅僅是市場短期的randomness導致，以至於不知道什麼時候應該捨棄這個策略。

有的人可能會說很簡單，backtest呀。但是這就有一個更加本質的問題，歷史是不是可以幫助預測未來。我也承認，歷史是我們僅有的依靠。但這個依然不能根本上解決correlation和causality的問題，即使以前backtest有用但並不能保證未來也會一直有用，就像很多時候大環境發生了fundamental的變化，而自己又由於不了解自己的strategy的收益來源而沒有意識到這個變化對策略可能造成的影響，策略失效虧損但自己還依然寄希望於未來會重新有效起來。還有的人說那簡單，設置一個止損線，超過了就把策略扔掉。但是這個被動管理的方式對於我來說並不太能接受，自己由於物理專業還是傾向於fundamentally知道為什麼會失效，這樣心裡會有一個收益風險大概的把握。其實也就是我們需要清晰知道這個策略收益的來源或者causality是什麼，或者用行業黑話就是知道自己的edge在哪兒，如果不work了那麼可以檢查是不是來源出了什麼本質的變化。如果strategy的源頭沒有fundamental的變化，那麼很可能只是短期的一些微擾反而是加倉的機會；但是如果是應用的環境出了fundamental的變化，這個策略就應該被及時從pool裡面剔除出去防止更大的損失。(也稍微提一下另外一個困擾我的問題，就是如果構造的策略表現不好，怎麼區分是由於自己對細節沒有處理好，還是這個策略本身的方向就不work。我暫時想到的辦法就是首先清晰了解自己的收益來源，並且model的假設和應用環境都很match，這樣至少先確定大方向是正確的，然後再去improve細節。如果努力之後依然表現不好，那麼其實也就可以放棄繼續花精力在這個方向上面，因為即使這個方向是正確的，要麼就是這個策略sharpe ratio並沒有那麼strong，要麼就是自己沒有足夠的能力可以完成這樣一個策略，不管哪一個其實及時止損都是明智的)

這裡提一下現在很火的AI或者deep learning的策略，由於很多過程是black box所以我們很難清晰的知道這中間自己的收益來源是什麼，這樣實際操作起來就會遇到一個問題，那就是我們是不是應該相信這個結果。如果表現好那自然是相安無事，但一旦表現惡化我們是不是應該繼續堅定的相信，也許就是短期的不work而已，去除掉沒準第二天又表現好了反而自己割肉在最底部；但如果一直相信卻一直又在虧損怎麼辦。這個兩難的問題其實就是由於收益的來源不清晰導致的，不過對deep learning這一類黑盒策略除了被動設置止損線似乎也沒有很好的解決辦法。

hedge fund在市場上找尋alpha的行為其實本質上就是在找inefficiency，上面提到的機構的政策限制本質上就是其中一種inefficiency。

但是隨著市場越來越有效，信息的傳播也越來越快，inefficiency/pattern/logic/mis-pricing也越來越少，也不再具有那麼強的sharpe ratio，持續有效的時間也越來越短。這裡引用之前寫的machine learning文章的一張圖就非常能說明問題：

這可能就是為什麼市場上越來越難賺了，特別是美股這麼有效競爭的市場，想要獲得一點點edge都很困難。而且hedge fund尋找市場上alpha的行為本身會讓這個市場越來越有效，但只要利潤足夠，或者說只要不低於一定的lower bound，在20%利潤提成的吸引下，都會有hedge fund拼盡全力來獲得市場上的超額收益。所以在高強度的競爭壓力下大家的收益都會不可避免越來越少，市場也越來越有效，雖然不會變成perfectly efficient，但是可能會不斷接近這個理想值。由於越來越難賺錢或者付出和收穫不成正比，hedge fund也會越來越少，當過多的fund放棄，那麼剩下的fund就會收益改善，又重新吸引新的fund進場，當過多fund的時候，競爭又會讓收益比變小重新擠出去一些fund。這樣就達到了一個動態的平衡。

雖然會是這樣一個動態的平衡，但我覺得市場未來越來越efficient的趨勢是不會變的，因為所有發生的alpha或者可以說市場上的inefficiency都已經被找出來補上了，也會越來越難找到剩下的alpha。畢竟金融市場上的蛋糕就這麼大，甚至會一直飽和下去。再疊加現在大數據和自動化的趨勢，市場上的數據和信息的流動也會越來越即時，甚至就直接有那種即時track各項指標的系統不斷傳回來以前需要很多人工而delay信息，這樣也會讓市場對數據的反應越來越有迅速。比如下面的圖是用無人機即時監控原油庫存，這樣都不需要等報告出來就可以預先得到這一類的數據。

除此之外還有用衛星拍攝監控超市門口顧客車的數目來預測財報之類一系列非常具有想像力的方法，都會讓這個市場對於數據的inefficiency延遲越來越短。

我們可以想像市場有一個均衡的線，圍繞這個均衡值的波動其實就是由於市場上的inefficiency/mis-pricing導致的，隨著未來市場越來越有效，圍繞著均衡值的波動也會越來越小，一旦機會出現所有人就都online了。其實也可以把這個想像成一個彈簧振子(本來以為這是我自己針對經濟周期的發明，但後來發現已經有這個理論了...心塞)，大家都逃脫不掉回歸這個均衡的宿命，並且如果未來變成完全有效，所有人都被困在這個均衡的線上動彈不得，那其實也就不存在市場了。

那麼是不是說未來的波動率VIX會越來越小呢？我也不知道，人是一個local的動物，由於ego這個東西會不由自主以自我為中心來思考問題，往往overestimate短期和身邊發生的事情，而underestimate長期的趨勢，所謂灰犀牛。當人們突然意識到長短預期衝突的時候就會產生VIX，比如最近忽如一夜通脹來。

當然這個推論的前提是fund的目的是為了找alpha，這其實也是我想要argue的一點: fund的目的是不是真的就是為了找到市場上的alpha。

我現在越來越多的感覺到其實在大牛市裡面hedge fund是很難beat market的。

今年新年可能有一件事情大部分人都忽略了，媒體似乎也鮮有報道，那就是巴菲特和對沖基金一百萬的10年賭約正好結束了。股神贏了。

我們先來看一張圖，

巴菲特一直認為長久來看hedge fund這樣主動投資的收益會跑輸大盤，也就是巴菲特選的sp500的index fund。具體的賭約內容就是巴菲特和Prote?ge? Partners在2007年各自拿出50w打賭，十年為期限，index fund的收益會高於hedge fund的收益。上面的圖就是巴菲特選的index fund和Prote?ge? Partners選的hedge fund的收益對比，數據取自巴菲特2017年的致股東信鏈接(http://www.berkshirehathaway.com/letters/2016ltr.pdf)。今年致股東信也給了這個賭約一個比較官方的ending。

從這個圖裡面我們可以看到兩點，

第一點就是hedge fund在大跌的時候是優於大盤的，2008年其實hedge fund是比index fund表現更好，因為次貸危機使得大盤跌了37%而hedge fund普遍只跌了20%左右，這其實是一個巨大的優勢，可能是由於hedge fund有足夠的對沖工具比較靈活。

第二點就是如果在這麼一個一騎絕塵的長期大牛市裡面，hedge fund是很難跑過大盤的，我們也可以看到隨後被大盤逐年反超，沒有一隻hedge fund能夠持續beat大盤。我覺得原因可能是hedge雖然是會控制一部分的風險獨立於大盤，比如說系統性大跌的時候跌的比較少，但是同時也對衝掉了向上盈利的空間，導致在長期牛市裡面顯得束手束腳。

這個賭約讓我現在更傾向於認為hedge fund似乎更是一種防範市場系統性風險的途徑，而不是只用來獲得長期的高收益。或者說hedge fund可能主要優勢在於降低了和大盤的相關性，而不是在於獲取alpha高收益，大盤跌的時候hedge fund反而是具有優勢的。其實市場上也是有這樣的需求，有些個人或者機構資金量比較大的情況很可能是需要diversify風險，平時不賺錢甚至虧錢都沒關係，但是一定得獨立於大盤的系統性風險，這樣才能保證整個portfolio的risk exposure是穩定的。之前也聽大牛們說過特別是像FOF或者endowment這一類的asset allocator對選出來的money manger有明確style role要求，如果轉換了風格也就意味著失去了整個portfolio里的這個特定的角色，其實也是挺身不由己的。

當然，我相信市場上的fund manager是很有過人之處，也確實可以既獲得獨立於大盤的alpha又打敗大盤，但是市場的有效性決定了這樣的fund只能是鳳毛麟角，大部分的manager還是只能二選一，要麼獨立甚至反向於大盤犧牲掉收益率，要麼long大盤承受高波動，最慘的就是既不獨立大盤又沒有大盤收益。

大盤真是一個魔咒，看起來簡單，但實踐起來似乎又很難做到。那為什麼大家不直接go index呢？

人們對於index fund不太感冒的原因可能就是這個設計本身就是不可能超過平均，有一种放棄掙扎的無力感覺吧。人這個動物其實無論多麼理性，還是不可避免會存在著一些美好的幻想，比如相信自己就是那個被選中的孩子，比如，自己可以跑贏大盤。

而且更重要的是，沒有人知道什麼時候會是大牛市。

比如站在08年的底部有誰敢出來說接下來十年美股是超級大牛市。大部分的觀點從來都是hindsight，如果有人知道的話那其實又變成了上面說的預測布朗運動，即使猜對了很大可能也是幾率使然。假如從次貸危機到現在聯儲什麼也不做就任憑古典主義自由市場自動調節，像30年代一直持續recession或者變成非常volatile的環境，也許hedge fund會反過來超過大盤也說不準。就像現在聯儲開始了加息的議程，也許就拉開了逆轉這半個世紀降息路徑的序幕，波動率回歸之後市場反而更適合hedge fund。如果換一個regime再來一個10年賭約，還真不一定就是大盤穩贏。

所以，我並不覺得主動管理會被index fund取代。特別是如果資金大幅進入index fund反而更容易造成集體的擠兌，一旦黑天鵝會使得大家的收益率都很難看。所以更可能會形成一種平衡的局面，但是隨著市場越來越有效可能會有一些變化。

由於之前提到的effectively inefficient，我感覺以後可能會有兩個趨勢：

(1) 一個是馬太效應會越來越明顯。大的fund有更多的人力所以有更大的幾率發現市場上的inefficiency，試錯的成本比較低。比如可以招更多的researcher來讀paper將新的idea快速轉化成生產力，還可以嘗試更多的技術創新，比如deep learning可能是有潛力可以在市場上挖掘到那些以前沒有發現的local inefficiency的alpha因子，我想這可能也是各個fund都開始大量投入精力在這個方向的原因，至於是不是真的有用也很難說，一個是理論還不成熟不易於理解，另一個是即使有效也不會說出來。

除開尋找市場上的alpha更有優勢，大的fund還可以把portfolio management的每一個環節的細節做到極致，這個是需要fund內部長期經驗的積累，並且對最終的收益好壞是至關重要的，這個領域單打獨鬥靠一個明星基金經理的英雄主義越來越難，更多是靠優化整個系統的每一個環節，而這個是很需要整個大團隊的細分合作。

(2) 第二是隨著市場越來越有效到付出和收益不成正比的時候，很可能那些AUM較小的fund就不再過多把精力放在找市場上的alpha了，而是轉型成比較輕型的fund。就像製造業上中下游分工一樣，很多公司會轉型變成專心處理比較high level的management，而不會親自從上游的開採原材料開始。未來也許會流行介於被動投資和主動投資之間的passively active investment，比如說近幾年火起來的smart beta，不同類別的因子其實都有專門的公司已經做好，而且可能湧現大量這種公司之間競爭來保證因子的質量和多樣化和降低因子的成本，他們其實自己也可以是大的fund，同時又可以充當提供因子的金融服務商，把不同的市場和風險分類打包做成很多種因子，甚至還可以根據客戶的要求來定製化，然後fund manager們可能就是需要利用自己的市場經驗或者machine leanring量化出來的權重來選擇和動態組合這些因子構建自身的portfolio，而不是每個fund都需要把整個基本流程重新自己做一遍，而僅僅只是專註於針對自身需求做這種base因子personalized的改進和優化，可以減少整個行業重複投入的人力成本，節省的部分可以用來降低整體的管理費。這樣對manager們其實是一種釋放，節省下來的精力可以投入到研究市場的driver和細化的factor的連續，更精準的掌握和主觀控制整個portfolio的風險暴露和收益來源(這裡推薦一本書，Expected Returns，國內可能對AQR還不是很熟悉，但是他們的paper也是很推薦讀一讀，就像橋水一樣也是一個很神奇的公司)。當然，就像(1)裡面提到的，如果有特彆強的fund也可以用自己積累下來的技術經驗來清理數據構造自己獨有的因子，保證質量最高和細節充分可控，就像蘋果公司一樣硬體軟體一條龍都自己做來收益最大化。

當然這裡說的主要是比較成熟的市場，國內的市場可能還遠沒有這麼efficient，不過我們也可以看到市場有這個趨勢。

比如對比美股和A股，美股已經非常有效，所有的信息都很快可以反映在市場上面，就像那些noise可以互相cancel out在市場上只留下有用information(這個理論可以參考the wisdom of crowd這本書，大概意思就是市場上參與者足夠多的時候，每個人都擁有不同程度的信息，那些uncertainty會相互抵消而有用的信息會留下來，所以使得價格不至於偏離均衡太遠)，從而每時每刻的定價都相對比較合理，很難產生很divergent的預期或者movement。有的人可能會argue美股現在已經泡沫這麼嚴重，但是其實這個估值是基於當下的低利率，產生資產泡沫反而很正常，詳情可以看我寫的Macro入門notes。

但是A股還屬於一個比較閉塞的環境，並不是所有人都擁有有用的信息，而且正因為自己沒有足夠信息沒有方向需要找一個心理寄託所以會相信別人有，散戶大多喜歡盲從，所謂information cascade，所以很容易變成形成一個個小預期之後迅速反轉，因為這個預期本身就跟true fact相去甚遠，所以noise並不能cancel out，反而會形成很短期不符合事實的clustering，這樣就造成了波動率非常大，其實這也是一種inefficiency。

國內最大的inefficiency其實還是政府對金融市場的調控和監管，但是這個更像是一個雙刃劍，導致策略的regime switch會變得很快，然而在量化領域可能這一塊兒是最難控制的，像前面介紹的需要同時對金融市場和對統計model的適用範圍和前提假設都深刻理解才行。但是上面說的馬太效應的趨勢同樣也會越來越明顯，大型的fund由於信用有保障所以資金來源成本會比較低市場資源也比較豐富，在當下這種資金收緊的大環境下其實是很重要的生存條件，而新成立的fund就需要經歷一個非常艱難的積累record的時期，可能很多fund都不是由於實力差被淘汰掉，而是這個過程對於新玩家有太多的不利因素，比如資金成本高要求多，技術不成熟，團隊管理經驗不足等等，任何一個都可以導致失敗。不過呢，也不用灰心，假如政府是真的想把市場蛋糕做大在國際上和美國競爭，越來越開放是必然的。這樣對於fund的限制會越來越少，機會也會越來越多，當然也會直面國際上成熟玩家的競爭，所以在這之前的嚴冬是一段比較適合完善自己積累實力的時期，為未來的團戰做準備。

科研其實也給了我不少啟發，概括來說我們高能物理領域的目標就是用物理變數結合各種統計方法利最大程度增加信噪比然後做理論的hypothesis test，統計方法也包括machine learning和deep learning。在analysis裡面想辦法減少background的時候我突然想到，Boosting Tree很多時候是在努力減少那個最dominant的background，而這個background其實用很簡單的線性cut就可以去除掉大部分，所以Boosting Tree很大部分的工作都跟線性的cut重複了，這實際上是在用大炮打蚊子。

但是，並不是說非線性model就沒用了，因為我們可以用線性cut之後再用統計model去學習那些非線性的residual部分(就像time series裡面de-trend使得dataset變得stationary一樣)，這樣不僅線性的信息我們可以通過線性的pre-selection拿到，同時對於residual裡面一些非常local的結構我們就可以用更非線性的機器學習和深度學習來做這件事。

放在量化上也一樣，市場上大部分的收益也許90%都已經可以被那麼幾個線性的幾個傳統因子解釋(如下圖，就是近半年非常火的AI基金，基本上就是大盤的曲線，我覺得很有可能就是因為直接把所有信息提供給AI，學出來的自然是佔90%收益的linear beta，和大盤相關性這麼大也make sense)。這樣其實也說明了在這樣一個局面下，大家同質化會很嚴重，想要獲得超出別人收益很難，所以真正能讓我們獲得alpha的是利用那些細微的residual inefficiency信息。這樣，我們其實是可以用線性的model去穩定賺beta，並且把剩下線性因子解釋不了的那部分的inefficiency作為input給更擅長非線性的model去挖掘有效的信息。

underlying的市場是線性的，所以有效性很高，但是我們之前也了解到期權衍生品是非線性的，所以相對來說衍生品市場就沒有那麼有效，也更容易賺錢。所以我也在想，正好現在很fancy的ml/dl的model也都是用來處理非線性問題，那不是正好可以應用在衍生品市場么？當然這只是一個小想法，不知道有沒有人做過。

還有關於物理的一個啟發，根據最近Physics Review Letter上的一個paper(https://journals.aps.org/prl/pdf/10.1103/PhysRevLett.120.024102)，ML還可以用來預測chaos系統。文章裡面主要是用於預測物理複雜系統的演化的極端情況，我感覺在金融市場似乎也很有潛力。因為金融市場的recession甚至depression其實都可以看作是小几率的fat tail時間，就像複雜系統的蝴蝶效應一樣，如果我們能夠選取一些合適variable然後讓ML的model來學，也許就可以學出來這些比較大的volatility spike的timing，或者給出classification的probability distribution，其實也可以看做是對於未來風險的一種系統演化模擬。如果確實有效的話，這樣對於投資其實可以即時的調整權重和資產類別來balance風險。

講完了這麼多，再真的談一談選擇和未來。

興趣，這是我每篇文章都會提到的一個東西。

如果突然對某個東西很感興趣，千萬不要放過這個高效率的時間段，堅決去做這件事，出現了這種時間段是非常幸運的，一定會有所收穫。其實很多時候我都是在感興趣的東西之間切換，有時候喜歡小說，有時候喜歡哲學，有時候喜歡心理，有時候喜歡宏觀，有時候喜歡隨機過程和option，有時候喜歡統計，有時候喜歡ml和dl，有時候喜歡高能物理科研，有時候喜歡熱力學，有時候喜歡量子力學，有時候喜歡QFT，有時候喜歡群論，有時候喜歡宇宙大爆炸和廣義相對論，有時候喜歡做菜，有時候喜歡跑步，有時候喜歡游泳，有時候喜歡旅遊，等等等等。一定要把握住這些時間段，屏蔽掉其他所有的影響，just do it，因為興趣driven，所以收穫的效率會非常高。

就我而言，也沒有人告訴我需要學這個那個，似乎一直是好奇心驅動。這些興趣對我來說其實都有一個共同點，那就是都可以幫助我更好的了解這個世界，尋找那些點之間的聯繫並且連起來，這種模式的東西我似乎都挺感興趣。能夠掌握每個知識點，然後融會貫通成一個整體，繼而精鍊成一個solid的大框架，再提煉出最關鍵的地方用最直白的語言把整個框架描述出來，讓其他人在不知道細節的情況下都能一下明白關鍵之處，這個過程似乎適用於所有專業。但是有一點一定要引以為戒，不要加太多技能點。我現在深深體會到了時間不夠用，而且怎麼學都覺得自己學的太表面，心理上也會焦慮，當然就我來說可能是來源於物理的執拗，希望能理解所有的東西，但是真的沒必要。在技能點數目超過自己負荷之後，引用韓寒的話，全面發展等於全面平庸。有一點生活還是非常公平的，那就是給每個人的時間都差不多，一個人的成就很多時候就是取決於這一輩子你把時間花在哪兒，再加上一點運氣。

接觸了這麼多領域的model，無論物理的金融的統計的，發現很多原理也可以借鑒到人生選擇里。

比如machine learning的classification。假如我們把自己看作是signal，平均水平看作是background，是否有variables可以幫助區分開我們和其他人的整體。其實也就是我們的優勢變數有什麼。如果有一個或者幾個非常強的優勢，那確實可以直接很明顯就可以outstanding，任何一個優勢都可以讓我們變突出；但大部分人都並沒有極強的天賦，還有一種途徑就是沒有一個很強的優勢，但是每一個變數都超過平均值一點，就像訓練boosting tree一樣把所有小變數合起來假以時日其實也可以幫助讓我們區分於其他人。所以一定要找到自己能區分於其他人的variable，並且讓這些variable之間產生correlation，使得自己既能通過單個variable讓自己突出出來，還能通過不同技能variable之間的融會貫通的綜合能力(其實也就是相關性)來讓自己突出出來，這種就是非常難得的人才了。比較慘的就是反過來，什麼都差一點，也可以讓自己很容易被分辨出來…

還有其實人生也可以看做一個優化問題，一個是local optimal，一個是global optimal。

人是local optimal的動物，往往overestimate local的事情，underestimate global的事情。很多時候我們做的決定是基於當下local環境和所掌握的信息達到最優作出的決定，但是局部最優不一定會得到全局最優。而個人的興趣或者天賦其實就像一個全局最優的indicator，因為這個東西是inner motivation，在整個人生看來最能持續，自己也最有效率，即使短期看起來沒有那麼高的收益，但是長期來說積累的量變引起質變。人和人之間的距離越來越大的原因可能也在於此，我們大部分人都會不由自主專註於local optimal，拉長時間跨度來就和全局最優漸行漸遠。

甚至怎麼做好一個leader也是一個優化問題，好的leader一定是能看到全局最優，並且因此能屈能伸沉住氣，對這個全局最優有著堅定的信念，以至於能改變大部分人之前不同的觀點。剋制其實並不是真的是說克制慾望，而是說可以剋制local optimal，慾望只不過是local optimal的一種表現。只有真的能夠看到global optimal並且堅持做下去，才能算是真正的leadership。但是能看到global optimal的如果不能down to bottom來handle細節，那麼只能變成高談闊論脫離實際。

回到隨機這個話題，很多成功人士都說運氣很重要，我一直很不以為然，但是現在越來越體會到了這種隨機過程的魅力。

每個人都有自己對於未來的projection，基於自身的經驗和推斷其實很多結果都是想得到的，但這其實就是一種固化，如果一直這麼發展下去很可能就是會按照自己設想的軌跡一直走，也許一輩子都會陷入局部鞍點逃不出來。但是生活中的隨機性其實給了你其他的可能性，也就是一種exposure。當自己的信息或者理解都處於一種固化的階段，如果來了一個change很可能就是對自己很有利的，可以讓自己思維的這一潭死水活了起來，就像gradient decent可以特意加上一個隨機擾動perturbation，去各個地方見各種人聊天做各種絲毫看不出local效益的事情，也許陷入鞍點的固化思路和局面一下就打開了。這也許就是為什麼很多成功人士把運氣這個東西放在很重要的地方，是因為真的很重要。

random walk其實對於人生也一樣，各行各業無時不刻總有人在做，有的人是堅定的支持者，但大部分人都是機緣巧合碰巧就處於這個行業中。如果這個行業興起了，那麼所有的人都會被當做先驅供奉起來，如果這個行業失敗了，那麼所有的人都會被遺忘。但是行業的興替總是會一直存在，所有總會有一批人會在每個時刻被供奉起來。但這些對於我們個體的選擇來說其實並沒有很大借鑒意義，因為我們並不知道什麼時候什麼東西會興起，即使在這個行業的所謂」先驅"其實也不一定知道，那最開始的小部分人也只是單純的相信這一條路而已，大部分人更其實都只是不小心進入這個行業或者後來看到趨勢之後進來ride這個trend。我們所能做的其實也只有選擇自己真心愿意相信的，而不是去預測什麼在什麼時間會成為下一個風口，就跟股市漲跌一樣，總會有下一個風口或者機會，歷史上也每時每刻總會有一批人會成功，大部分的人都是被運氣或者隨機的洪流所裹挾，我們能做的只有深刻認識自己並且找到自己堅信的東西一直做下去，無論最終是不是會成功。作為先驅堅持自己相信的東西，其實就很像期權long gamma，在創造這個trend之前我們需要不斷承受theta的損耗(社會上其他人的質疑，還有殘酷的現實)，所以要麼trend形成一飛衝天，要麼就被theta耗死。

似乎有點唯心主義，我們的存在取決於我們相信的東西。

附上「50cent」過去一年的收益圖:

一個人的命運啊，當然要靠自我奮鬥，但是也要考慮到隨機的進程。

現在的中國很像20年代充滿了朝氣和夢想的美國，這一百年來在美國發生的也會不斷在國內重現。在浩浩歷史洪流面前，所有人都奮力前行逆水行舟沉浸在各自精心構築的黃金年代裡。這裡也以毛姆描述那個年代的小說《刀鋒》里的結尾來結尾：

「而這片人海又是被那麼多的矛盾利益困擾著，那樣迷失在世界的混亂里，那樣渴望好的，那樣外表上篤定，內心裡彷徨，那樣慈善，那樣殘忍，那樣誠實，又那樣狡猾，那樣卑鄙，又那樣慷慨。」

感興趣的盆友，這裡推薦一些參考的資料:

(1) options futures and derivatives

(2) dynamic hedging

(3) stochastic calculus for finance 1&2 [Shreve]

(4) MIT open course(Mathematics with Applications in Finance)

(5) A Practical Guide to Quantitative Finance Interviews

(6) 北大國發院金融經濟學25講徐高

(7) Dynamic Asset Pricing Theory(3rd)，Duffie