隨機過程、機器學習和蒙特卡洛在金融應用中都有哪些關係?

最近了解了一些數學金融中用到的數學, 隨機過程,機器學習和monte carlo。但是不太明白這三者的關係是什麼,請教內行易於理解的講一講這三者在金融中是如何應用的,彼此的關係。謝謝


心有林夕的回答實在是太豐富了!
不過我崇尚簡練和直奔主題,具體展開看夕哥的答案吧。

隨機過程:
資產的價格序列 X1 X2 X3 ....Xt 就被當成了一個隨機過程來研究。所以研究隨機過程的性質, 狀態在金融數學中很有用。現代金融裡面最常用的布朗運動也是很多模型的基本假設。

Monte Carlo:
簡言之就是一件事算N 次,這N 次的平均數就應該是這個事件的期望E(X)。而E(X)恰恰就是我們要求,但是又沒法解出來的東西。 比如一些奇異期權,我們能夠列出微分方程,卻解不出來奇異期權的解,就用monte carlo模擬微分方程所代表的路徑,然後求平均數,就估計出這個期望值了,我們的定價目的也就達到了。Monte Carlo求的是數值解,BS公式之類得到的是解析解。

機器學習:
本質上機器學習跟金融數學沒有一丁點關係。不過機器學習的作用就好比統計分析, 其實這倆是一回事,就是對實際的金融市場數據進行建模,試圖達到預測、分類的目的。時間序列分析,回歸分析也都是用來干這個的,當你覺得你找到了也些市場數據中的PATTERN覺得你自己可以預測了,你就覺得做交易獲利了。
所以機器學習是針對處理數據來說的,跟金融數學、資產定價神馬的理論沒有關係。不過處理金融數據卻是實際工作最實用的技能之一,機器學習只是最近比較熱門的數據處理方法,把它跟傳統的計量經濟學、時間序列分析、回歸分析比較比較合適。


隨機過程是以時間為參數的隨機變數,可以用來模擬隨時間演化的市場。隨機過程理論可以幫助我們理清相互依賴的隨機過程(如標的資產和衍生品價格)之間的數學關係(如伊藤引理)。它是我們研究金融市場的基本數學工具。

Monte Carlo是摩納哥著名賭城,同名數值演算法意味著讓電腦大量生成可能的隨機過程樣本,在這些樣本中計算需要的量(如未來現金流的貼現值),並求期望。

機器學習是用系統的數學方法分析數據,並得出結論。

一般來說,我們用機器學習分析現有數據,用隨機過程理論進行理論建模,在必要時使用Monte Carlo方法對模型做數值模擬。


非常贊同心有林夕和August Lee的解答,我來也簡單的說一下把。
首先本人現在專業是金融數據分析,實質在做機器學習。

隨機過程:這是一門學科,它原本是一個非常理論的學科,算是概率論的後續衍生學科吧,這其中自然包含著大量現代數學的經典產物,泛函分析的東西,所以事實上它是一個難的學科。 不過,這個學科在目前發展迅速正是因為它的理論可以被廣泛應用於實際問題,並且還可以結合其他方法處理複雜問題。

Monte Carlo: 例子和細節樓上都說了很多了,我想說的這事實上只是一種基於抽樣的經典統計方法。

機器學習: 這是我目前學習研究的主要方向和領域。事情上這確實與金融沒有任何關係,因為機器學習可以被應用於金融, 也可以應用於生物,也可以應用於物理化學之類的。實質上,它只是一種泛泛而論的一大類問題的總稱,核心思路就是,訓練——學習——預測/分類, 從而達到機器自動處理一系列問題。所以它的要求是大規模,高速度的運算處理問題。不過,訓練,學習,預測/分類 本身並沒有任何方法,本質是這些點上都需要運用基本的方法和理論,比如說隨機過程,比如說Monte Carlo,比如貝葉斯,比如時間序列,再比如一些經典的統計學方法。 目前本人做的就是基於貝葉斯方法和高斯過程對股票價格進行機器學習的預測。


上面已經說了隨機過程和蒙特卡洛是Q宗定價,機器學習是P宗交易
我補充一個:用機器學習開發信用卡反欺詐模型,絕對是每一個學習機器學習的童鞋一定會遇到的金融應用。
其實,這三個領域在信用風險這個金融領域都很有用,側重點不同


打個比喻吧。隨機過程好比模型,蒙特卡羅好比計算方法,機器學習是處理數據的方法。假設要研究一段隨機過程,例如某個金融產品的價格過程。你可能會認為(依據金融知識和一些基本假設)它是屬於某一類過程的(只餘下一些參數要估計),比如認為它屬於ou過程。然後利用收集到的數據(比如離散時間上的觀測值)估計參數,這需要統計(機器學習)的方法。這個過程中還可能用到蒙特卡羅模擬來計算某個隨機變數的期望。


隨機過程是最重要的,是模型的理論基礎,一個模型的邏輯框架必須建立在隨機過程理論的堅實基礎之上,否則根本不敢用。整體框架搭建的好,模型表現自然好,在此基礎上的參數優化不容易過度擬合,而且容錯性好(參數不敏感)。

機器學習是一種方法。為何要學習?要麼是歷史未能反應全部規律,新的歷史帶來對規律的補充;要麼承認規律是有局限性的,或呈分段函數特徵,而你希望跟蹤當前模式。一般而言機器學習特指達到一定深度的學習,但其實本質上就連最簡單的均線也是一種學習過程。
舉例1:我用動態學習的方法去優化資產配置方案,相較於全局更不容易過度擬合。
舉例2:我將K線形態劃分為100+種線性無關的形態,利用機器學習方法自動去尋找合適的形態,節約人工、提高效率。

蒙特卡洛是一種偽隨機的方法,一般用於尋優,不過效率極低,尤其是變數複雜度很高的時候,很可能原地打轉。但是,解決「非凸問題」並沒有更好的辦法,像退火演算法、遺傳演算法、神經網路等啟發式演算法只是蒙特卡洛的衍變,本質上還是有限枚舉,而且無法保證收斂。對於很多優化,我的方法就是限制精度後窮舉,這樣至少精度可控。


對於金融研究的蒙特卡洛,首先計算技術生成的是偽隨機,只有仍硬幣才能算是真正的蒙特卡洛
其次,蒙特卡洛不適用於金融研究,因為金融走勢並非純粹的隨機
純粹的隨機,即上帝扔骰子決定下一秒的多空,這點跟casino的baccarat類似,蒙特卡洛來研究gamble是可以的
借用纏中說禪大師的話,決定金融走勢的不僅僅是上帝扔骰子這一個力,它只是眾多分力之一
基本面、政治、突發事件、眾多交易者的交易行為本身、上帝扔骰子,這幾條分力共同作用下產生的合力才能決定金融走勢,所以隨機漫步在金融里肯定是不足以解釋市場的


寫得簡單一點。

隨機過程就是一些衍生品定價的基礎,比如著名的black-scholes期權定價公式,其中一個假設就是期權中的股票價格走勢符合幾何布朗運動,然後幾何布朗運動就是一個連續的隨機過程。同樣的,如果要在black-scholes基礎上發展更複雜的估值模型或者推導其他定價方法,隨機過程都是一個基礎。

機器學習:目前機器學習的應用更多在計算機視覺,數據分析和數據挖掘等領域。比較常見的演算法有線性回歸,神經網路,目前比較火的深度學習也是神經網路的一個分支。總的來說,機器學習就是一門關於數據的學科。目前很多人都很急切地想把機器學習應用到金融領域,但是金融數據有自身的獨特性。

蒙特卡洛,是科學計算的一種方法。高票答案也提到這個理論起名的緣由,挺有趣的,現實中也有數學家熱衷於到賭場里驗證理論的。蒙特卡洛是一系列方法的統稱,主要思想就是通過計算隨機變數的分布來計算實際問題的數值解。在金融中的應用主要是用蒙特卡洛模擬進行期權定價。

所以,這三個東西沒什麼關係啊…


推薦閱讀:

張量分解如何應用於數據挖掘?求詳細說明,最好有例子!?
如何優化正交矩陣?
有沒有將深度學習融入機器人領域的嘗試?有哪些難點?
技術上講,王樹森和吳佳俊誰更牛逼?
想去上海交大讀研,計算機視覺與機器視覺怎麼選?

TAG:機器學習 | 金融 | MonteCarlo | 隨機過程 | 蒙特卡洛方法 |