智能金融的發展路徑

文:鮑捷|發佈於 2016年9月8日

今天講的是我最近一些思考的總結。也不能算是很系統的思考,主要還是想拋出一些問題來和大家探討。之前也有幾篇文章,今天說的算是這些的延展:

智能金融的核心驅動力 2016-08-03什麼是互聯網投行?(全文)2016-08-01

智能金融變魔術的6個步驟 2016-06-21

即將到來的智能金融軍備競賽 2016-04-28

人工智慧與投資價值判斷 2016-03-28

歷史文章 – 文因互聯

這些文章都在我們的博客上,其中一些想法在發表在程序員雜誌的第8期,「知識圖譜如何讓智能金融變魔術」。

從事這份工作一年多時間了。從去年5月開始,我們就在實驗如何把人工智慧的各種方法用在金融上。這一年我們做了哪些事情呢? 我簡單從兩個方向回顧一下:市場與技術。

技術回顧

人工智慧技術在市場上有很多切入點,所以最初我們是選擇以新三板進行切入。因為無論是從數據量上、還是從決策對智能技術的支持的需求緊迫度上看,我們覺得在價值判斷整個市場渠道里新三板這個市場最重要。所以我們花了將近一年的時間來構造整個基於價值判斷的金融體系,並在此中造了十幾個零件。

而我們現在做的這個就是基於理念把這些零件湊在一起,變成一輛車,也許是自行車,也可能是三輪車或者是小轎車。我相信在現在這個市場處於一種服務非常不充分的狀態,任何一種工具,你只要能夠抓住關鍵的切入點,都有可能造出一個在某個細分市場上被人用的工具。

所以下圖差不多總結了我們近幾個月來對這個智能金融深入的思考。因為在最早的時候,我們在追求變「魔術」這件事情,想達到顛覆性的效果。特別是在今年三月份AlphaGo出來之後,各種媒體新聞報道很多,然後就是智能投顧,大家都在說人工智慧進入金融,分析師要失業了,機器要取代人的工作了。那個時候我們就在想,這件事情是可能的嗎?特別是我們一回國的時候,就有人說你們應該去做Kensho,包括我們現在去見投資人的時候,投資人就強烈地說你們應該去做Kensho。

Kensho在我看來,就是這種變「魔術」的一個運用。但是冷靜下來去思考這個市場上大家到底需要什麼,或者說我們真正想達到那種變「魔術」狀態,我們在之前需要做什麼樣的準備,只能通過真正看到具體的數據、看到具體的需求的問題。你會發現其實變「魔術」這件事情都不應該當作追求的目標,因為在變「魔術」的這個過程當中,實際上從最底下的物理世界的數據,到最上面的這種金融人才通過經驗和人脈才能做出來的決策,中間有非常多的步驟。我覺得一個智能金融的企業不是應該一步到位去追求變「魔術」,而是在這個過程當中涉及的每一個路徑當中的每一個點有可能被商業化的地方,才是解決的目標。所以我把這個過程分成6個步驟。在這個過程中,每上走一步都是數據不斷完善,我們每得到一些更好的數據,就可以幫助我們更快更好的解決問題。

最底層的就是臟數據,臟數據打個比方來說就是證券時報上的信息披露板塊,純粹是為了滿足證券會的要求。巨潮網就是解決這樣的問題,但是因為PDF掃描件的存在,這樣的問題並沒有完全解決。

第二步就是乾淨的數據,比如說Wind、東方財富這些可以達到查詢效果的數據終端,目前這是屬於解決比較完好的問題。

再往下一步就是實體數據,實體與實體之間的聯繫,比如說公司之間的供應鏈關係,就是圖譜數據。

然後再往上走就是業務邏輯,每一個金融從業人員都是有自己的世界觀和方法論的,不管怎麼選擇、命名、關聯、定義都是他的業務邏輯,那現在這些業務邏輯都是要每一個金融從業人員反反覆復的用自己的工作經驗做判斷,如何讓業務邏輯更好被表達,這就屬於變魔術了,然而這也是需要繼續探索的未知的東西。

分析層面也有6個層次:

第一個層次就是可訪問性。參加新三板路演的投資人,想要了解公司的基本信息,但是那些數據終端都是基於B端的,稍微複雜一些的數據在手機端訪問不了,而文因互聯的搜索就是解決這樣一個問題。

第二個層次就是可發現性。從紛繁蕪雜的數據里找到少數真正有價值的數據必須要有工具幫忙過濾,提升可發現性,讓投資人把精力放在最關心的事上。

第三個層次就是深度關係的發現。股轉書里的風險提示,根本沒有人可以把每天所有新聞過濾後對應到公司中,深度關係的發現就是找到那些人力根本看不出來、看不過來的關係(如事件風險、隱藏股權邏輯)。

下面兩個層次分別是領域知識集成和業務知識集成。領域知識的集成是具體的業務場景的基礎數據和領域知識的基礎上表達業務邏輯,方便重用和學習。再有就是業務知識的集成,具體的業務場景的基礎數據和領域知識的基礎上表達業務邏輯,方便重用和學習。

到最後就是魔術,也就是策略的生成。有各種業務邏輯和規則,是不是能機器能幫助我們做出判斷呢?機器把可以幫助我們簡化問題,也可以把一個問答可以簡化成一個選擇題,也許可以幫助我們加快做選擇題或問答題的速度,但是真正的策略最終一定是人去做。所以在這一點上,不僅僅是一個所謂的人工智慧問題,在我看來也是一個人機交互問題,怎麼能夠讓人更好的去發現策略、驗證策略。

這是從這個技術的角度來說每一個層面都對應著不同的分支去解決這些問題,我在這裡列了一個表,但我不打算把這個表裡的每一個技術名詞都解釋一遍,因為如果要講可能要講四個星期。

我們現在做的差不多都是前幾個層次,後面一些還在嘗試,因為構建這樣一個系統其實是需要幾十個人進行大量技術投入完成的,所以在有限的資源下我們先完成的是前面兩個層次,也就是文因互聯的金融搜索。

如下圖所示,一個典型的文本處理引擎有以下模塊。早在今年4月份我們做的就是文本處理引擎,通過預處理、過濾廣告、格式編碼結構篇章、各種各樣細節的處理。然後再做各種淺層的語義分析,包括實體、名字、地名的句子的標註與段落的標準。然後下面呢,就是一個相對深層的分析。最後就是到應用層面,就是各種面向用戶的應用工具的展示,包括語義檢索、自動化報告等等。

但是一個完整的智能金融系統的核心,不僅僅是關於爬蟲和自然語言處理,它包括了知識提取、知識表現、知識存儲和知識檢索這四大分支幾十種細分技術的綜合運用。

對上述技術,6月份的時候我們在北京知識圖譜學習小組做了為期4周的簡單科普介紹。GitHub - memect/kg-beijing: 北京知識圖譜學習小組

9月19日在西山賓館,在中文信息學會知識圖譜前沿技術講習班,我和林德康老師會再做一次綱要性的介紹。

最近我在想我們這個做的這些所有關於智能金融的技術,這些很多提高效率的工具它到底有什麼價值?最後我們的COO孫洋想到了一句話——讓金融狗們把更多的時間用來創造價值,不把寶貴的時間用在無謂的簡單重複勞動上,讓有效的生命延長。就算不用在創造價值上,每天多睡一小時,每天多談一小時戀愛,幹什麼不(比當個機器人)好啊!

所以就是,用文因互聯每天延長一個小時生命。

文因搜索search.memect.cn

針對買方(投資機構)細分行業 —— 支持任意關鍵詞,語義關聯相關產品多種板塊 —— 輕鬆搜索A股、美股、早期項目企業對標 —— 智能分析企業業務,自動尋找對標針對賣方(企業)基金偏好 —— 查看機構投資偏好深度關係 —— 深度挖掘投資機構附屬關係

在一次訪問中我發現,一些券商從實習生到老總都在用文因互聯的產品都在為他們節約時間創造價值。比如說董事長或者是高層明天去見客戶需要有對方公司關於基本面、競爭對手、產業鏈的資料,但是沒人可以在下班之前做到。現在有文因搜索就可以幫忙做到。像中層比如說做市部門,都需要這樣的一個以知識圖譜為基礎的搜索產品去幫助他們在決策鏈條的點上創造價值。

產業鏈分析

在產業鏈分析的一個小工具里輸入任何一個關鍵詞,可以在2萬個細分領域裡找到這個關鍵詞上有哪些公司。比如說,以園林為作為例子輸入關鍵詞,得到一些園林的代表性公司。而且可以看到園林的上游公司主要為賣化肥、建材、石材的一些公司,那麼下游呢,就是一些施工、景觀、工程、還有污水處理的一些公司。在以前,要想生成這樣的產業鏈分析,實際上是需要一個至少兩年以上工作經驗的分析師去閱讀大量研報才能做出這種的效果。不管是產業鏈還是對標還是供應鏈,都應該應用機器來部份的自動化這些工作。

文因快報 kuaibao.memect.cn

關注動態變化 - 提取公告摘要在審企業 —— PDF解析股轉書,每日推送上報企業重大事項 —— 通過企業公告與新聞事件分析異常其他各類細分主題,如人事變動,重大資產重組等等

這些市場的動態變化的跟蹤,就是我們的快報產品。這一塊後來我們延伸出來了很多自動化分析報告的工作,比如說異動分析報告就是在每天1000多份公告里找到哪些公告是最值得關注。這裡面有些領域規則是我們可以去定義的,這樣就可以把每一個行業當中最值得關注的報告先給推送給需要看到的人。像下面這個SaaS行業周報就是一個典型,涵蓋了SaaS行業在一周里發生了什麼大事情、交易情況、定增情況、再融資情況等。這樣一來,快報產品就是對那些券商內部做周報日報工作的人的解放,把大量基礎信息讓機器來做,對於那些機器做不了的工作比如說投資亮點的分析就再讓人去處理,這樣至少可以讓人力價值提高3-5倍。

股轉書PPT摘要

這個股轉PPT摘要也是來源自一個真實的案例,一位PE投資人馬上就要見競爭對手,就說你們能快速整理出這麼一份要素分析PPT嗎?我們一看差不多80%數據都已經有了,就非常快的把它生成了這麼一個PPT報告,當時還沒有自動化,現在這個已經全部自動化了。平台內一共有9000多份股轉書PPT,每個公司有10個點左右的關鍵要素,其中包括產品、公司治理、生產資質、競爭對手、財務情況、關鍵風險提示、發展要點等等。當然不同的投資人會關注不同的點,但是這個東西的核心就是至少可以幫助投資人做投資,這樣一份股轉書PPT摘要至少可以幫助投資人節省將近一個小時的時間。

微信企業秀

企業秀也是類似的產品,我們的微信企業秀就是為企業高管和董秘服務的,就是將200多頁的年報、半年報提取關鍵要素做成Html5頁面,目前和兩家新三板媒體公司做企業的推廣營銷。

上述這些嘗試,還是都一些局部的、不系統的效率工具。下一步,我們打算針對特定的業務場景,提供更完備的解決方案。

我們從8月份開始就是要將這一系列的小工具、小零件在一些具體的業務產品上造成車。比如說投前研究、市場跟蹤、投研分析、投後跟蹤。還有其他一些跟銀行有關的場景,比如說新興業務的股權質押。這些都需要把我們剛才提到的這些工具有機的組合起來。有些時候看風險,有些時候看價值,有些時候看發展,那麼怎麼去把大家最需要的形式在一個業務場景上面綜合在一起,就是我們當前做的最重要的一個東西。

上面是主要是談談技術的一個配置,還有包括我們產品。那下面呢,其實我覺得這塊可能更有意思,那就是從市場宏觀的角度,我們也做一個回顧。

市場的回顧

過去一年,我們調研了上百個相關企業,走訪了二三十家相關的企業。我們沙龍前後來過一百多位嘉賓,我們的郵件列表和維新群保持和幾百名金融從業者的日常聯繫。

我們前後寫的正式調研報告有幾百頁。我們公開寫的報告和博客也有幾十篇(blog.memect.cn),其中一部分整理在《文因洞鑒》中,目前出了第1期,第2期和第3期(互聯網投行專輯)下周就會出來。

在廣泛佔有第一手資料的基礎上,我們得到了什麼結論?

我得到的第一個感覺就是中國的股權投資市場其實是滿落後的,不能適應新形勢的發展。

傳統的券商,只能服務兩千家公司,現在勉強服務了一萬家(加上新三板)。但是中國可考的創業企業就有二十多萬家,規模以上(主營業務2000萬以上)工業企業37萬家,這50多萬家企業傳統的股權投資體系很難服務。無論是價值判斷還是風險評估,如果還按舊的辦法做,那要把人力擴充50倍才能完成,這是不可能的。所以隨著中國經濟的轉型,隨著中國投資結構從貸款和債權為主逐步轉變為以股權為主,一定需要技術的投入才可能完成這個轉變。能服務好50萬家企業的投行,就是互聯網投行。

幫助這50萬家企業,未來也許有100萬家企業,做好它們的價值判斷和風險評估,和互聯網投行這個潛在百萬億級的市場一起成長,就是文因互聯的核心使命。

第二,不存在真正的美國對標企業。

投資人總是問我們你們的美國對標企業是什麼?我不得不做了下面這個表。

其實我心裡覺得,並沒有哪個美國公司做的事情和我們是一樣的。我也請教了很多國內的智能金融的先行者,大家在產品價值和商業價值上,都在進行探索,可以說沒有哪一家得到了完整的答案。我一直有些困惑,直到一天因果樹的滕放和我說,他覺得是因為我們的金融創新走到美國前面去了。我們根本沒有先例可以抄。

美國是有AlphaSense, Kensho, CapitalIQ,但是美國沒有新三板,沒有中小企業產業升級,沒有區域金融結構調整,沒有雙創。美國對金融技術創新的需要,其實是不如中國迫切的。

其實就好像美國的鐵路一樣。美國有世界上最完備的鐵路系統,但是它的高鐵卻是落後於中國的。因為它沒有那種經濟發展的需要去更新它的鐵路系統。我覺得現在兩國的金融革新也是類似的。中國在一些具體的技術點上可以抄美國,就好像我們高鐵發展的早期一些具體的技術也要引進一樣。但是在整個全局上,我們沒有可以模仿的對方,必須進行長期艱苦的探索。但是我相信,中國這麼大的經濟體,中國智能金融這麼廣闊的發展空間,一定可以像中國的高鐵一樣,趕上並超越其他國家。

第三,不談邊界的智能金融,都是耍流氓。

3月份AlphaGo贏棋以來,一堆危言聳聽的預言。我以為凡是談人工智慧將如何如何取代人類的新聞,但是不談人工智慧本身局限的,都是耍流氓。智能投顧取代不了投資顧問,自動寫稿取代不了財經記者,正如ATM沒有取代銀行門店,計算器沒有取代會計。現在的「智能投顧」,智能性還和「智能燈泡」里的「智能」差不多,其實威脅不了人。

現在的人工智慧充其量只是作為智能助手存在。我們的生活中需要很多這樣的助手,比如洗碗機、洗衣機、電飯煲。智能金融做好刑偵大隊,不是去做法官,不是讓機器來代替人做判斷。

第四,智能金融之所以成立,是因為技術起到兩個層面的推動力 第一層次:機器取代人力,降低成本。讓原來無利可圖的商業模式得以成立。

第二層次:用軟體規範行為,標準化、透明化,從而擴大交易範圍,提高交易速度,降低交易成本。

第五,智能中心是一個生態系統,是以智能技術和核心,做好價值判斷和風險評估這兩大類要素分析,從而支撐企業、投資方、中介方、監管方等做好資源配置。

國內現在在金融技術上過於重視風控,而且一談風控就是反欺詐,這是不對的。其實如果我們的著眼點是服務中小企業,那光看風險是遠遠不夠的。中小企業光看風險,全身上下都是風險,根本沒法投資。所以要向前看,看企業的發展和價值。我們現在要落地,要服務銀行貸款、發債等,但是長遠看,一定是股權投資的比例成長快,空間大。要看價值,做價值投資。

抓住價值,放開了看,有非常多的事情可以做:

其他還能服務哪些需求?傳統金融終端如CapitalIQ能服務的,智能化的分析工具應該都能進一步提高效率。所以不應該僅僅盯著反欺詐不放。

CORPORATE DEVELOPMENT 計劃與執行Identify Deals 發現交易機會Conduct Valuations 估值Formulate Corporate Strategy 公司戰略制定Monitor Markets 市場監控

SUPPLY CHAIN, CUSTOMER & BANKING 供應鏈,客戶和銀行CREDIT RISK ANALYSIS 信用風險分析Select Counterparties 對標選擇Understand Exposure 披露理解Monitor Credit Risk 風險監控Track Market Developments 市場動態跟蹤

INVESTOR RELATIONS 投資者關係Monitor the Street 監控市場Analyze Competitors 分析競爭對手Identify Investors 發現投資者Prepare Board Presentations 準備董事會ppt

COMPETITIVE INTELLIGENCE 競爭情報Track Industry & Competitor Trends 跟蹤產業和競爭趨勢Uncover Opportunities 發現機會Gauge Wall Street Sentiment 衡量市場情緒Create C-Level Reports 寫高管報告

第六,不要言必稱金融大數據。智能金融是小數據問題,智能數據(smart data)問題。

我從來不認為文因互聯是個大數據公司。數據的深度比數據的量重要的多。僅僅是把大量的數據從網上收集來匯總,這能起到的價值並不大。我們關注的是小數據問題。大數據去中心化為小數據,並不只是規模變小,而是關注中心轉移到新的三個V。① value價值,不是連垃圾都存起來,而是特別關心數據的價值密度,提高投入產出比。

② veracity真實性,關心數據的可驗證性,可用性,自描述性等。③ versatile多能性,因為數據要用來交換,在交換中增值,所以要適應未知的應用。

小數據里當然大部分也是低價值的。其中被交換最多的那部分可稱為smart data智能數據。它有三個特性:①催化劑,它能加速價值的產生,在數據聚合中產生新的數據。例:人名實體鏈接。②濃縮鈾,它是大量知識和數據的提煉,是流動性好,摩擦力特別小的數據。例:產業鏈圖譜。③打折卡,是能降低成本,利用先驗知識大幅提高價值的數據。例:基於領域模型的行業標籤。

小數據的「小」也有三個方面:①「小用戶」 更多關心中小企業,個人用戶,他預算很少,投入敏感,沒有專家。② 小工具,類似蒸汽機的改進其實在於各種小機械,重視工具系統建設,和現有數據的集成和演化,降低認知成本,學習成本。③小周期,短周期演化,精益迭代,懶處理,減少數據處理的浪費。

小數據上的分析建模會很不一樣,沒有那麼多訓練樣本。因為這裡涉及知識,所以貓論和不爭論也很重要。①摸論,建模是一個在常識基礎上的摸著石頭過河。②貓論是說不追求普適,客觀的正確,只要在有限作用域可用就好。③不爭論是說要隔離世界觀,保證每個人各行其是。

總結

智能金融還是個初生的領域,它不是互聯網金融(Internet Infnace),也不等同於金融科技(Fintech)。我認為它的英文應該是Smart Finance。它是用人工智慧的方法,輔助人們進行金融領域價值判斷和風險評估的方法。它通過標準化部分決策步驟,來降低成本,從而使傳統不可能成立的商業模式得以成立。

智能金融並不神秘,也不神奇。它不是靈丹妙藥,也不是凶神惡煞。它現在在一些小事情上幫助我們,讓我們每天有效生命延長一小時(或更多)。在技術上,它也不是基於什麼天上掉下來的秘密,而是過去十幾年逐漸發展起來的一系列知識處理技術。我們要做的是看得大,但是做得小,利用好「小數據」技術。

大家看過《Moneyball》(點球成金)這個電影嗎?新技術引入一個領域的時候,難免大多數人不相信,同樣也難免很多人產生宗教迷信。我相信智能金融也是一樣的。這是很長的旅程。Just do it。

嘉賓問答

問:像互聯網金融、金融大數據,還有之前提到的互聯網投行。我覺得每個階段都有具體要解決的矛盾。現在風控的需求更強盛,後面可能就是金融投顧,所以造成的影響就是盈利模式不明顯。所以核心問題就是,互聯網投行模式是現階段解決的問題嗎?

鮑捷:基於現在的模式,銀行會衍生出一些盈利點,比如中小企業股權質押、知識產權質押、投貸聯動。但是無論面向現在,還是面向未來,新的模式的出現不是一夜就誕生出來,很多雛形有很多關鍵事件凝聚在一起才會讓一個新的模式誕生。除了銀行之外,還有大量規範後P2P、新三板、新四版,FA等凝聚在一起,才會誕生真正的互聯網投行。現在具體的一些點本身也是可以盈利的。現在券商和銀行已經和我們展開了有效的合作。
推薦閱讀:

社群營銷案例系列之二:金融行業
房價一直瘋漲的秘密在這裡
打新門檻提高後,收益被無情的攤薄了嗎?
【Excel圖表】- 製作專業級金融圖表(二):雙堆積圖
【轉載】SecurityScorecard發布2016年上半年美國金融行業網路安全情況報告

TAG:人工智能 | 金融 | 投资银行 |