不了解量化?來聽聽JP Morgan的建議吧~

金融行業的技術性工作總是像走馬燈一樣,「你方唱罷我登場」。在2001年對於互聯網公司的股票研究火遍全球,2006年大家的關注點集中在擔保債權憑證(CDOs);2010年,信用交易變為潮流;2017年則是機器學習和大數據登場的一年。

近期由Marko Kolanovic和Rajesh T. Krishnamachari領導的J.P. Morgan量化投資和衍生品策略小組發布了題目為「大數據和人工智慧策略--投資中的機器學習和另一種數據方法「針對大數據和機器學習在金融領域最為全面的報告。報告中提到機器學習在未來對於市場的變化。分析師、證券投資經理、交易員和投資主要負責人都應該熟悉機器學習技術。傳統的數據來源例如季度收益和GDP數值會很快變得失去價值因為經紀人們會運用新的資料庫和方法來提前預測這些指標並且在發布之前進行交易。這份報告共280頁,這裡我們對它進行簡化。

01. 銀行需要懂市場運行的優秀數據科學家

J.P. Morgan著重提到對於銀行和一些金融公司更偏愛數據分析技能而不是市場知識的做法,這是非常危險的。了解數據和信號背後的經濟學知識比單純的技術更加重要。

02. 機器可以用來做短期和中期的交易決策

摩根大通指出,在未來,他們說的機器將在中期中越來越流行,「機器已經快速分析新聞和信息的能力,運行交易指令,瀏覽網頁,並同時完成上述行為。這將降低對基本面分析、股票經理和宏觀投資者的需求。

03. 需要能夠獲取、處理和評估數據的人才

在實現機器學習策略之前,數據科學家和定量研究人員需要獲取和分析數據以獲得可交易的信號和洞察能力。

摩根大通指出,數據分析是複雜的。今天的數據量往往比昨天更大。數據包括從個人數據(如社交媒體的文章,產品評論,搜索趨勢等)到業務數據程(公司發布數據、商業交易、信用卡數據等)和由傳即感器產生的數據(衛星影像數據等)。這些新的數據形式需要加以分析,然後才能應用於交易策略中。他們還需要對這些數據進行「阿爾法內容」評估——他們生成alpha的能力。alpha內容部分取決於數據的成本、所需的處理量以及數據集的使用情況。

04. 有不同種類的機器學習。它們用於不同的目的

機器學習有各種各樣的迭代,包括有監督學習、無監督學習和深度學習和強化學習。

監督學習的目的是建立兩個數據集之間的關係,並使用一個數據集來預測另一個數據集。無監督學習的目的是試圖理解數據的結構,並找出它背後的主要驅動力。深度學習的目的是利用多層神經網路來分析一種趨勢,而強化學習則鼓勵演算法探索並找到最有利可圖的交易策略。

05. 監督學習將用於利用樣本數據進行基於趨勢的預測

在財政方面,J.P. Morgan表示,監督學習演算法將利用歷史數據來找到最有預測力。監督學習演算法分為兩類:回歸和分類方法。

基於回歸的有監督學習方法嘗試基於輸入變數預測輸出。例如,他們會考慮如果通貨膨脹率飆升,市場將如何移動。

分類方法遵循後向原則,並試圖確定一組分類屬於哪一類。

06. 無監督學習將用於識別大量變數之間的關係

無監督學習方法分為聚類分析和因子分析。

聚類涉及基於相似性的概念將數據集分割成較小的組。例如,它不能涉及識別高波動率和低波動率或上升和下降的通貨膨脹的歷史制度。

因子分析旨在確定數據的主要驅動力,或者確定數據的最佳代表性。例如,收益率曲線走勢可以用收益率的平行移位、曲線的陡峭程度以及曲線的凸性。在多資產組合中,因子分析將確定主要驅動力,如動量、價值、波動性或流動性。

07. 深度學習系統將承擔人們難以定義但容易執行的任務

深度學習實際上是人為地再現人類智力的一種嘗試。摩根大通表示,深度學習是特別適合於非結構化大數據集的預處理(例如,它可以用來計算衛星圖像重的汽車數量)。一個深度學習模型可以使用一個假設的金融數據序列來估計市場修正的可能性。

深層的學習方法是建立在神經網路的基礎上,而神經網路的靈感來源於人腦的運作。在網路中,每個神經元接收來自其他神經元的輸入,並計算這些輸入的加權平均值。不同輸入的相對權重是由過去的經驗確定的。

08. 強化學習將被用來選擇一個連續的行動過程以最大化最終回報

強化學習的目標是選擇一個連續動作的過程以最大化最終(或累積)回報。與監督學習(通常是一步過程)不同,強化學習模型不知道每一步的正確動作。

摩根大通的電子貿易團隊已經使用強化學習演算法。下圖顯示了它的機器學習模型。

09. 你不需要成為一名機器學習專家,你需要做一名優秀的量化交易員和程序員

摩根大通表示,數據科學家的角色技能是幾乎任何其他定量研究者一樣。現有的買賣雙方的量化人員背景包含計算機科學、統計學、數學、金融工程、計量經濟學和自然科學。定量交易策略的專業技能將是關鍵技能。「對於定量研究人員而言改變數據集的大小格式、用更好的統計和機器學習的工具應該比IT專家或者矽谷企業家更容易。」

相比之下,摩根大通指出,你不需要知道機器學習非常具體的細節--大多數機器學習方法已經編碼(例如在R),所以只需要應用現有的模型。他們建議初學者可以使用基於GUI的軟體如Weka小數據集。Python也有廣泛的庫,像Keras(keras.io)。有開源的機器學習庫像Tensorflow和Theano.

10. 這些是你需要知道的編碼語言和數據分析軟體包

如果你只打算學一種機器學習相關的編碼語言,摩根大通建議您選擇R和下圖所示的相關的包。然而,C++,Python和java也有機器學習的應用如下圖所示。

11. 一些常用的使用Python的機器學習代碼的例子

12. 支持性部門也需要理解大數據

最後,J.P. Morgan指出,輔助支持性部門同樣需要了解大數據。報告提到,太多的招聘官並不能區分高談闊論人工智慧的能力和實際設計出一個可用於交易的策略的能力。

到JoinQuant查看J.P. Morgan原文《不了解量化?來聽聽JP Morgan的建議吧》

推薦閱讀:

選題(2)——What is a Good Research Question?
如何拒絕給導師寫論文,導師自己並沒有想法,讓學生想,學生眼界更窄,不想為文而文?
在美國發表論文可以一稿多投嗎?
PRL投稿時,字數是否應嚴格小於3500words?

TAG:量化交易 | 机器学习 | 学术论文 |