人工智慧與投資價值判斷

發佈於 2016 年 3 月 28 日

文/鮑捷,段清華

本次「人工智慧與投資價值判斷」講座由中央財經大學德育示範基地——學術後援服務中心、保險學院團總支,保險理論研究協會共同舉辦。文因互聯CEO鮑捷博士應保險學院風險管理與保險系陳華副教授邀請,在本次講座中擔任主講嘉賓。

2015年在新三板上市的企業超過3500家,比整個主板的上市公司數量都要多。在新三板高速發展的同時,文因互聯(Memect,2013年成立於美國矽谷)也隨著它的創始團隊回到了中國,希望用他們從美國學術界帶回來的頂尖人工智慧技術,幫助中國的投資人更好地做價值判斷。

人工智慧輔助價值判斷的四個層次

第一層:基礎數據文因互聯產品的最底層構架是建立在基礎數據之上的,包括所有上市公司公開信息在內的基礎數據。文因互聯計劃逐步地公開開放這些數據。XBRL(eXtensible Business Reporting Language)是一種電子化、結構化的財務信息標準。在過去的十幾年中,美國證券交易委員會(Securities and Exchange Commission,SEC),英國皇家稅收與關稅局(HM Revenue and Customs,HMRC)都開始要求公司必須使用XBRL披露財務數據。以美國為例,這些格式化的數據,任何人都可以從SEC的網站上自由下載與使用。比如有的公司就會監視這些XBRL文件,只要從SEC的網站上一出現,根據分析結果,在兩秒之內就生成交易建議推送給它的客戶。

與之相比,中國已於2008年11月12日成立了XBRL中國地區組織,也建立了上市公司的XBRL申報制度,但還在非常初級的水平。在中國,一般人難以接觸到XBRL,它還停留在大公司與政府部門手中。

而這部分應該公開的數據,沒有真正地開放出來,這極大阻礙了中國金融服務業的自由發展。在大部分投資機構中,很多金融實習生,還必須把非格式化的PDF文檔包括公司報表、研報等等,整理為Excel、PPT等其他格式,這種機械的「腦力體力勞動」在當前時代是必須革除的。

文因互聯預計在數據整理完成之後,面向所有中國的投資機構、個人,免費地開放格式化的基礎數據,並且提供方便訪問的API,讓任何人都可以便捷地訪問到這些數據。除了XBRL承載的會計數據,文因互聯提供的數據還將包括一些非標準的報表數據。第二層:深度圖譜關係知識圖譜這個詞大家可能很陌生,其實它是人工智慧最重要的領域之一。與谷歌團隊擊敗李世石所使用的深度學習演算法相比,知識圖譜所使用的語義化技術,自然語言相關技術,在整個人工智慧領域都有更深層次的應用和前景。現在的谷歌搜索,iPhone上的Siri,IBM的智能問答系統Watson,背後都應用了知識圖譜技術。在投資數據上,我們可以用知識圖譜技術清晰地處理關於公司、股東、產業之間的關係。公司和公司,公司和人,公司和行業等等一切內在關係都可以在知識圖譜上展示、查詢、搜索。因為我們已經建立了實體之間的聯繫,我們就可以很容易地挖掘出企業的深度關係。第三層:業務場景應用

構建出知識圖譜只是更多應用的前提,是平台的基礎。如同先有iOS平台才有其上百萬的應用一樣,在知識圖譜這個平台上,我們可以構建出非常廣泛的應用。例如定增(定向增發),我們可以挖掘定增後面的原因。之前我們遇到一個例子:有家公司在去年以1塊錢的低價,定增了大量股份給公司外部的人,後來才發現這是它被外部收購的前兆。只要我們通過知識圖譜處理好公司與高管、公司與定增之間的關係,這種信息就可以很容易地在知識圖譜中被挖掘出來。還比如怎麼尋找併購標的、怎麼進行資產管理、如何進行企業徵信、如何構建完善的企業畫像,這些都可以在知識圖譜上做。第四層:智能助手智能助手涉及到更高級別的人工智慧應用。這方面包括關於金融的領域問答、投資顧問、情報分析,甚至全球市場範圍內的信息預警、輿情監控。

在美國有家名為Kensho的公司,在2014年拿到了1000萬美元的種子輪投資,Kensho的目標之一就是回答類似 「當油價高於100美元一桶時,中東政局動蕩會對能源公司的股價產生怎樣的影響?」,「朝鮮核試驗後 48 小時內韓國公司三星的股價變化」這樣的問題,這就屬於情報分析,信息預警的智能應用。Kensho這種預警只是智能助手的一種可能性。在知識圖譜的基礎上,我們可以開發出更多的智能助手在金融領域的應用。

機器如何擴展我們的智力?

在1804年的時候,人類發明了蒸汽機車,在最早的時候它的時速只有5公里,用煤炭或木柴做燃料。這個速度遠遠比馬車要慢,所以如果在當時,有人告訴你有一天火車會完全代替馬車,那是不可想像的。像這種技術的階躍現在也正在發生,這就是人工智慧領域。人工智慧會影響及代替一部分人的工作,然後它會創造出更多的工作,就好像雖然我們現在沒有了馬車夫,但是火車相關的職位實際要多得多。人工智慧的這次階躍,重要的是擴展我們的智力,讓我們從「腦力體力勞動」的苦海中脫離出來,讓人能去做更有創造力的工作,而不是那些簡單重複的工作。

人工智慧解放人類的第一點,就是解放「腦力體力勞動」,這方面包括但不局限於那些金融領域初級員工的工作。其中是包括大量Copy & Paste(複製和粘貼)工作的。新三板企業上市所需要的公開轉讓說明書平均超過250頁,而這樣的文件超過7000份,人類幾乎不可能大海撈針的從中簡單獲取到我們想要的信息。而這還不包括其他信息,例如研報,新聞,公告等等。現在從事基礎研究的金融從業員工,每天面對大量這樣的文件。人工智慧可以自動地將文本信息抽取、結構化,甚至進行分析,從而大大節省金融研究人員的時間成本。

人類的能力是有限的,據我們在業內的調查,一個複雜的金融關係圖表,一個實習生平均一天可以做兩張,一個熟練的研究員一天只能收集30條數據。而人工智慧的目標是,在洞察力上達到人的水平,卻能成百上千倍的並行工作,達到人遠遠達不到的超人規模。大家可以想像,如果我們能以更低的成本和更高的速度完成這些基本的工作,那將會帶來多大的價值。

人和人之間的信息交流速度是極其緩慢的,如果我們將人與人之間的對話、文字的閱讀,這些數據量化,那麼實際上只能達到每秒幾比特的信息量(bits/sec)。而我們知道就算是放在20年前,電話撥號上網的時代,電腦也能以每秒幾千、幾萬比特的速度進行通信。一個比較現實的例子是,假設我們不依賴任何外物包括手機紙筆,那麼我們能記住多少電話、QQ、微信號碼?然後我們有了紙筆,我們就擴展了這部分能力。現在又有了智能手機,我們可以記住成千上萬人的聯繫方式,這就是機器對人的智力進行擴展的一方面。人類終將擁有擴展的海馬(腦中的記憶單元),機器承載的第二記憶,世界的記憶終將在機器的幫助下互聯。

在金融領域中,往往一個研究員在一個很長的時間裡都在進行僅僅針對某個特定領域的研究,為什麼會有這種局限性?很簡單,是因為人類的記憶力和信息處理能力是有限的。我們無法處理太多的信息,我們接收、處理信息的速度遠遠比機器慢。機器的教育成本很低,複製成本很低,機器將輔助人構成社會,幫助我們擴展進化中獲得的有限的認知能力。這種人和機器混合構成的社會,被成為Social Machine。這並不是科幻,是已經發生的事情——想想人們多麼依賴手機。

挑戰與機遇

在人工智慧發展的過程中,很多職業都會被影響。這其中可能包括分析師、投資經理、交易員、財務顧問等等。他們的工作都會從大量的重複勞動,變為其他的更有創造性的勞動,幫企業創造更多的價值。而從區段上說,現在人工智慧已經在影響早期投資、場外交易、上市公司的再融資及公司的併購,在以後會逐漸向二級市場等等外圍擴充。從問題的角度說,最先解決的可能是標的的選擇、行業分析、快速價值判斷及規模交易等等。在人工智慧影響金融的過程中,可能有一些職業會消亡,但是會有更多的職業,更多的產業與價值被挖掘出來,這就是未來的機遇。

人工智慧是一個很大的門類,包含很多不同的子科學與學派,現在眾所周知的深度學習技術,實際上就是人工智慧中的統計與機器學習學派在近些年興起的一種新演算法。人工的不同學派在金融領域都有不同的用武之地,例如:統計與機器學習:?行情預測(Rebellion Research)?交易學習(Alpaca Trading Co.)?對沖演算法(Castilium,Bridgewater)?機器人投資顧問(規劃,組合,執行)自然語言處理:? 事件分析(Kensho)? 量化交易(Sentient)? 機器人新聞(Yseop,Automated Insights,DreamWriter)

語義與知識:

? 信用監控(Garlik)? 數據集成(摩根大通)? 風控(宜信,普惠金融)? 財務建模(富國銀行)? 財務報表自動化(XBRL及相關技術)? 語義搜索(FIBO工作組)人工智慧的應用已經在各個領域上都有了很多應用,一般人可能很難體會到它的存在,實際上技術正在不斷地改變著我們的生活。

技術階躍面臨的困難

在火車比馬車還慢的時代,沒人需要火車,如果你問一個人需要什麼樣的交通工具,他們會說需要更快的馬車而不是火車,因為他們無法想像到火車的便利。火車的發展並不是一帆風順的,實際上在通信還很落後的時代,為了保證火車之間不會相撞,是有一匹馬跑在火車前面隨時偵查的。而今天火車的成功,是因為大量配套設施的完善,例如鐵軌、更先進的燃料、更方便的信號傳遞及更好的計時系統等等。回到人工智慧的話題,現在人工智慧也面臨著很多問題。現在人更相信人而不是機器。機器確實會犯錯,但是從大概率的角度說,一個設計良好的機器犯錯的概率遠遠比人低,並且可以預測機器會更穩定,不受任何外界情緒和感情的影響。機器解決問題需要的成本也遠遠比人低。機器開始會顯得很愚蠢,只能接收人類的指揮。但是這個過程會隨著數據逐漸增加,技術不斷進步,機器速度會越來越快而最終解決,最後機器會成為超越人類的智能助理。就如同火車需要鐵軌,人工智慧的發展也需要大量的配套基礎設施,例如更多的公開數據,更好的數據互聯等等。人工智慧要完成技術的階躍,同樣不會是一帆風順的。在這個過程中需要面臨很多問題,很可能等很多基礎設施完善之後,它才能真正開始改變世界,改變我們的認知。我們相信,這一天遲早要到來,而文因互聯正在做的,就是在加速這個過程,讓我們的生活更好。

階躍發生所需的背景

技術背景:? 報表的電子化、結構化? 大規模文本分析技術? 開放數據,數據互聯? 知識圖譜

就像SEC推行XBRL一樣,最開始肯定是數據的電子化、結構化,現在中國政府也在大力推行盡職調查的電子化、結構化,這一條是人工智慧技術在投資領域發展的基本要求。結構化數據的過程中,會需要大規模的文本分析技術,其中包括自然語言理解、報表分析、數據校驗等技術,最終的目的是將文本轉變為機器可以讀取的格式化數據。這些技術在近年已經逐步成熟,工程的可實現性已經被驗證了。基礎數據應該是開放的、互聯的,只有這樣才能為知識圖譜的建立做好準備。到最後數據完全圖譜化,讓數據搜索、分析、整理的成本都降到最低。在這時人工智慧的各種應用會不斷的浮現,逐漸創造出一個千億甚至萬億的產業。金融業背景:? 互聯網化? 量化(交易、風投)在中國,金融業還是一個很傳統的行業,有大量的數據沒有聯網,沒有結構化。而階躍所需要的條件之一,就是金融業能整體的互聯網化、量化。而恰恰這是在過去十年中被證明有效的。

中國背景:

? 投資供需失配

? 直接投資比例應提高

? 人民幣基金興起

? 註冊制,新三板

? 大量新行業缺少分析

? 後期融資和上市公司投資服務不足

人工智慧要在中國金融領域紮根,離不開中國的背景。中國的大背景就是金融業的不斷發展與改革,投資供給增加,投資市場化。上面提到的一些是現在正在不斷演進的過程,一些是正在面臨的問題。這些問題也同時帶來了巨大的機會,很多在美國上世紀70年代就已經沒有的機會,現在在中國則出現了。

但是這些問題的解決,僅僅用舊的方法是不行的。問題的規模遠遠大於過去我們熟悉的問題。傳統的投行體制、傳統的工作流程都很難應對新的挑戰。過去幾年,我們已經看到大量的模式創新,在早期股權投資、新三板投資上迅速成長起新的投資機構。今後,我們預期不僅需要模式創新,也需要技術創新來解決這些問題。如果沒有新技術的介入,沒有生產力的提高,這些問題是不會自我解決的。只有用人工智慧真正的解放金融業的生產力,才能改善生產關係,才能更好、更快地解決這些問題。

可能的趨勢

投資從「大數據」走向「智能數據」數據絕對量是否大並不重要,實際上對於人來講,大於「7」的數據都是大數據,因為我們的短期記憶無法記住超過「7」的信息。只有經過機器智能化的處理成為深度數據,發現人力無法洞察的關係,才能真正的幫助投資。

互聯網投行的興起

投行的互聯網化,將從依賴人的「作坊」走向依賴系統的平台。在這個平台上有大量的公開數據,可以直接通過這個平台查詢、搜索信息,甚至完成交易。

從機器輔助價值判斷走向規模交易

走向規模交易,就如同興起期權交易的「淘寶」,根據智能數據的投資,都在一個平台上就能完成,極大的節省了人力物力。

新三板上成長起中國的「高盛」

新三板和可能被實施的註冊制,將有助於產生更好的投融資平台。新三板的整體的體量可能會翻數倍、甚至數十倍,在這個過程中很可能會出現中國的「高盛」。文因互聯的基礎技術

首先我們獲取到一些非格式化的公開數據,這些往往都是文本數據。然後我們對這些數據進行格式化,編碼化、數據清晰。對文本結構、文章和頁面進行分析。在這個過程中,會有中文分詞、句子標註、辭彙分類,最終提取出不同的實體。這些實體包括人、組織、機構、時間、金額等等信息。最終這些信息經過校驗、異常處理、數據標準化等等步驟,合併成為知識圖譜。

通過知識圖譜,我們可以發現很多深度的投資關係。例如:? 企業是否間接被主板企業控股?? 企業的實際控制人是否還有其他未上市公司沒有披露出來,它們的業績怎麼樣? ? 企業在全球市場上有多少競爭對手和相似企業?? 企業的整體產業鏈結構都是什麼樣的,整個產業鏈都被控制在哪些公司,或者哪些人手中?

這些問題都可以通過知識圖譜在實體間進行推理、語義搜索得到。而通過語義技術,我們可以做到:

? 通過任意關鍵字全方位的搜索企業、研報、人與人的關係;? 行業的檢索,產品的檢索,解決目前行業不準確,新型行業無法分類的問題;? 深度挖掘與提取各種信息,從大量文本中生成關鍵信息。

現在流行「互聯網+」的概念,也有人提到「人工智慧+」,然而當它們再次與金融投資攜手,能迸發出什麼樣的火花?讓我們一起期待吧。
推薦閱讀:

如何評價醫藥行業分析師(醫藥行業研究員)這一職業?
"00後"金融入學指南
底薪4000,那些靠天吃飯的金融農民
上海租售比達到 900 時,年收益率百分之一點多、75 年才能回本,還要不要買房?

TAG:人工智能 | 投资 | 金融 |