人工智慧正在逐步走進金融領域

發佈於 2016 年 2 月 29 日

文/王叢

隨著互聯網時代的深入發展,我們獲取的各種數據都在無限膨脹,遠遠超過了人類大腦的處理能力,於是機器學習技術成為更利於發展的投資策略。以機器之手在互聯網中抓取一個領域的數據和信息,將這些信息通過人工智慧系統進行細緻的分揀和篩選,進而得出最終的結論和決策。之後再將這些已被梳理好的決策分析反饋給該領域工作人員。接下來我們會分三期就人工智慧和金融領域的結合做一系列分析,釐清人工智慧在金融領域已經都做了哪些嘗試,以及成果:

1.運用人工智慧進行量化交易;2.人工智慧輔助金融新聞、報告、投資意向書的半自動化生產;3.人工智慧進行行業、企業的語義搜索。本文專註於【運用人工智慧進行量化交易】,後兩者會在之後的微信公眾號文章推出。量化交易從很早開始就運用機器進行輔助工作,分析員通過編寫簡單函數,設計一些指標,觀察數據分布,而這些僅僅把機器當做一個運算器來使用。直到近些年機器學習的崛起,數據可以快速海量地進行分析、擬合、預測,人們逐漸把人工智慧與量化交易聯繫得愈發緊密。我們可以把量化交易按照人工智慧的子領域(機器學習,自然語言處理,知識圖譜)分為三個階段。

一.機器學習

分析員們對財務、交易數據進行建模,分析其中顯著特徵,利用回歸分析等傳統機器學習演算法預測交易策略。這種方式有兩個主要弊端,其一是數據不夠豐富,僅限於交易數據,更重要的是它受限於特徵的選取與組合(Feature Engineering),模型的好壞取決於分析員對數據的敏感程度。此外一種做法是,模仿專家的行為,選擇某一領域的特定專家,複製他們的決策過程,並導入可重複的計算框架。代表公司:

總部位於紐約的Rebellion Research在2007年推出了第一個純人工智慧(AI)投資基金。該公司的交易系統是基於貝葉斯機器學習,結合預測演算法,響應新的信息和歷史經驗從而不斷演化,有效地通過自學習完成全球44個國家在股票、債券、大宗商品和外匯上的交易。日本的初創公司Alpaca,他們的交易平台Capitalico利用基於圖像識別的深度學習技術,允許用戶很容易地從存檔里找到外匯交易圖表並幫忙做好分析,這樣一來,普通人就能知道明星交易員是如何做交易的,從他們的經驗中學習並作出更準確的交易。倫敦的對沖基金機構Castilium由金融領域大佬與計算機科學家一同創建,包括前德意志銀行衍生品專家、花旗集團前董事長兼首席執行官和麻省理工的教授。他們採訪了大量交易員和基金經理,複製分析師、交易員和風險經理們的推理和決策過程,並將它們納入演算法中。坐落在香港的Aidyia致力於用人工智慧分析美股市場,依賴於多種AI的混合,包括遺傳演算法(genetic evolution),概率邏輯(probabilistic logic),系統會分析大盤行情以及宏觀經濟數據,之後會做出自己的市場預測,並對最好的行動進行表決。全球最大的對沖基金橋水聯合(Bridgewater Asspcoates),使用一種基於歷史數據與統計概率的交易演算法,讓系統能夠自動學習市場變化並適應新的信息。與其類似的公司還有Point72 Asset,Renaissance Technologies, Two Sigma。

二.自然語言處理

人們發現僅僅從數字推測模型是不夠的,開始考慮引入新聞,政策,社交網路中的豐富文本並運用自然語言處理技術分析,將非結構化數據結構化處理,並從中探尋影響市場變動的線索。這方面直接用於投資交易的並不多,更多是用於風控與徵信。通過爬取個人及企業在其主頁、社交媒體等地方的數據,一來可以判斷企業或其產品在社會中的影響力,比如觀測App下載量,微博中提及產品的次數,在zhihu上對其產品的評價;此外將數據結構化後,也可推測投資的風險點。這方面國內的很多互聯網貸款,徵信公司都在大量使用自然語言處理技術,例如宜信,閃銀等。另外一些公司則利用這些技術進行B端潛在客戶的搜尋,如Everstring,並將信息出售給其上游公司。代表公司:

CommEq是今年6月份在倫敦新設的一家基於人工智慧(AI)的對沖基金。CommEq的投資方法結合了定量模型與自然語言處理(NLP),使計算機能夠如人類一樣通過推斷和邏輯演繹理解不完整和非結構化的信息。由李嘉誠與塔塔通訊投資的Sentient Technologies運用自然語言處理,深度學習(Deep Learning)等多種AI技術,進行量化交易模型的建立。Kensho是美國一家基於雲計算的智能計算機系統先鋒公司。Kensho 結合自然語言搜索,圖形化用戶界面和雲計算,為金融市場的投資人們提供一套全新的數據分析工具——Warren。Warren 能夠回答覆雜的金融市場問題,如各種數據、股票走向等,可回答約 100 萬種關於全球事件對股價影響的英文問題。

三.知識圖譜

上述技術經常會在一些意外發生的時候預測失敗,例如911、熔斷機制和賣空禁令等等。人工智慧系統沒有遇到過這些情況,無法從歷史數據中學習到相關模式。這時候如果讓人工智慧管理資產,就會有很大的風險。此外,機器學習擅長發現數據間的相關性而非因果性。很有名的一個例子是早在1990年,對沖基金First Quadrant發現孟加拉國生產的黃油,加上美國生產的乳酪以及孟加拉國羊的數量與標準普爾500指數自1983年開始的10年時間內均具有99%以上的統計相關性,1993年之後,這種關係莫名其妙的消失了。這就是由於自學習的機器無法區分虛假的相關性所導致的,這時候就需要專家設置的知識庫(規則)來避免這種虛假相關性的發生。

知識圖譜本質上是語義網路,是一種基於圖的數據結構,根據專家設計的規則與不同種類的實體連接所組成的關係網路。知識圖譜提供了從「關係」的角度去分析問題的能力。就金融領域來說,規則可以是專家對行業的理解,投資的邏輯,風控的把握,關係可以是企業的上下游、合作、競爭對手、子母公司、投資、對標等關係,可以是高管與企業間的任職等關係,也可以是行業間的邏輯關係,實體則是投資機構、投資人、企業等等,把他們知識圖譜表示出來,從而進行更深入的知識推理。

目前知識圖譜在金融中的應用大多在於風控徵信,基於大數據的風控需要把不同來源的數據(結構化,非結構)整合到一起,它可以檢測數據當中的不一致性,舉例來說,借款人張三和借款人李四填寫的是同一個公司電話,但張三填寫的公司和李四填寫的公司完全不一樣,這就成了一個風險點,需要審核人員格外的注意。

而以新三板投資為例,知識圖譜可以將企業的投融資、上下游,競爭等關係關聯起來,從而展示出一家企業在行業中的全貌。如下圖所示,我們可以看到德瑞鋰電的客戶惠州德賽是國資委投資的,這就符合某些投資人的邏輯,是一個投資亮點。此外還可以看到,德瑞鋰電的材料供應商是什麼情況,以多少比例從註冊資本多少的企業供貨,這也可以判斷企業是否可以持續穩定的生產。

以投資關係為例,知識圖譜可以將整個股權沿革串起來,方便地展示出哪些PE機構在哪一年進入,進入的價格是多少,是否有對賭條款,這些信息不僅可以判斷該機構進入當時的估值,公司未來的發展情況(公司成長的節奏),還可以看清PE機構的投資偏好,投資邏輯是如何變更發展的。目前知識圖譜在工業界還沒有形成大規模的應用。即便有部分企業試圖往這個方向發展,但很多仍處於調研階段。我們認為這其中的難點在於如何與特定領域機構建立起一套合作方式,如何將合作變成一種可輕易編程的界面,讓領域專家可以通過系統以一種非常簡單的方式進行行業邏輯的建模,而他的邏輯可以通過系統實時得到驗證,使其進一步更新,只有通過專家與機器反反覆復的迭代,形成閉環,才會服務好用戶。

代表公司:

知識圖譜在金融最早的應用代表是Garlik。這家公司2005年成立於英國,核心成員來自南安普頓大學(University of Southampton,是語義網的核心研究機構之一),主要業務是在線個人信息監控。他們收集網路和社交媒體上的個人信息,當發生個人信息盜竊時Garlik會及時報警。2011年他們被美國的三大個人信用記錄公司之一Experian收購,其技術被用於個人信用記錄、信用盜竊的分析。Garlik的核心技術之一是大規模語義資料庫,前後開源發布了3store, 4store, 5store等高性能資料庫。

Palantir,估值僅次於Uber的科技創業公司,曾用大數據幫助CIA幹掉本·拉登。他們有一個基於知識圖譜的金融數據分析平台—Palantir Metropolis,可以整合多源的量化資料,並提供一套方便易用的分析工具來滿足複雜的研究需求,其中的組件能夠進行複雜搜索,可視化編輯與分析,有非常豐富的人機交互能力。

參考:

[1] Wired,The Rise of the ArtificiallyIntelligent Hedge Fund,The Rise of the Artificially Intelligent Hedge Fund

[2] MITTechnology Review,Will AI-poweredHedge Funds Outsmart the Market,Will AI-Powered Hedge Funds Outsmart the Market?

[3] 李文哲,知識圖譜的應用,知識圖譜在互聯網金融中的應用

文因互聯作為一個專註新三板投融資的基於知識圖譜的團隊,意在將行業領域的全球領先公司的信息應用到新三板掛牌企業的價值判斷上,這也是人工智慧技術給予金融行業發展帶來的實質性幫助。作者簡介王叢 文因互聯CKOWright State Univ計算機科學博士生,專攻知識表現與推理。曾參與歐盟LarKC項目,前 後在DERI,IBM,西門子實習,TU Dresden訪問。JAIR,TKDE,ISWC等頂級刊物、會議審稿人。
推薦閱讀:

盈透、芝加哥交易集團及七禾網邀請演講內容文字整理(三)
銀行賺錢模式小解(基礎篇)

TAG:人工智能 | 金融 | 科技 |