金融知識圖譜的現狀和展望
本文整理自文因互聯CEO鮑捷在3月29日舉辦的金融知識圖譜論壇上所做的開場報告。
如果我們把金融知識圖譜放在一個更大的圖景里來看的話,可以看到整個 FinTech 行業的發展。過去三四年大家聽到最多的一個詞就是互聯網金融,最近一兩年有智能金融這個詞冒出來。在我的理解裡面,它代表了 FinTech 的上半場和下半場。任何技術在去改變,或者革新一個已有的產業,通常就會有這樣一個上半場和下半場。
上半場重點在提高效率,在互聯網金融這個領域,主要是解決觸達的問題。不管是交易也好還是平台也好,P2P 也好,其實它是在解決如何把原有的資源更好地組織在一起的問題。它把線下的搬到線上了,把原來效率低的提高效率,主要解決了一個觸達的問題。但是當一個技術真正深入到一個領域,它將行業效率提升到了一個很高的程度,之後會發生怎樣的情況?通常會有新的商業模式應運而生,產生一個重構。以前它不能夠形成的商業模式,不能夠做的很多應用,因為新技術的支持可以做了。我覺得這塊恰恰就是我們今後兩三年,甚至三四年的時間內的一個重心。這一塊的重心就不僅僅是由於互聯網而更多的是由人工智慧來支持的。
在這個從觸達到重構的變遷里,其實很多經驗不完全適用。在更早的互聯網應用裡面,無非就是加錢、加人、加機器解決問題,因為互聯網的應用,它是一種複雜的系統。但是對於智能系統,它也是一種複雜系統,但它不是 complex system,它是一個 complicated system,它裡面有非常精細的小結構在裡頭,不僅是通過加錢加人就能夠解決這個問題,所以兩者的發展路徑上會有點不一樣的地方。
第一個階段就是信息化,包括銀行之前做的就是這件事情,比如我們用紙質的文檔,現在變成一種機器的文檔,從線下到線上解決這個問題。
第二個階段是大數據化。過去其實十年的時間,一開始不叫大數據,但其實做的東西就是大數據化,就是把割裂的分散的數據把它集中在一起。一開始它叫數據倉庫,後來叫大數據,最近又叫雲,每家銀行都在做,券商也在做,交易所也在做。實際上是要把這個數據從割裂狀態,變成一個融合的狀態,變成一個大數據,解決這個問題。
這兩年應該說從 2015 年開始,我們又進入了下面一個階段,就是一個自動化的階段。在我們有了這麼多數據之後,我們發現很多東西是非常繁瑣的,用人工來轉移這些數據,不如用機器來做這種重複性的工作。我們用更智能的程序,來幫我們自動化這個過程,把繁瑣變為簡單。這也是最近兩三年的時間,我們在很多分支里都看到了的嘗試。
智能化可以說是緊跟著自動化開始,我把它稱為從畫龍到點睛,也就是整個系統裡面,我們以前是人做所有的工作。但是人應該和機器在一起形成一個協作系統,機器做複雜的事情,而人是真正的價值創造者。只有人才能夠點睛,智能化就是要把這個過程變成讓機器來畫龍,人來點睛的過程。
大家對知識圖譜可能不是很熟悉,我這裡就來簡單講一下我個人理解的知識圖譜。在我看來知識其實就是結構,我們最簡單的知識就是字典,我們用一些詞去定義另外一些詞,所以這就是形成了詞和詞之間的結構。
另外一個結構,就是行業上下游。每一種行業,我們都可以畫出這個行業的上游產品、下游產品是什麼;在每一種產品上有什麼樣的公司在提供這樣一種服務。以前我們都是用人工來做這樣的事情,它可不可以自動化呢?以前我們對於比如A股上市公司,可能只有那麼幾百個行業,我們可以人工來做。但現在我們面臨的是上萬家上市和掛牌公司,上千個細分行業,我們能不能用機器來提高效率,來做出這樣的知識圖譜呢?應該是可以的。
所以整個知識圖譜技術的核心,就是如何把數據結構化。在傳統的資料庫研究裡面,我們已經看到了數據是結構化的。知識圖譜技術,從某種程度上來說,是資料庫技術往前的一步,把傳統的表格結構所不能處理的複雜的關係,用更新型的資料庫來進行存儲、表達。這個技術雖然是從2012年開始才為大家所知,但從淵源上講,已經有差不多15年到20年的發展時間了。
這四個不同的領域,發展到了某一個關鍵節點,都發現要想解決各自領域裡的問題,必須用結構化數據,進而就形成了知識圖譜這個技術。
我就簡短地說一下,今天主要的時間留給各位主講嘉賓。今天一共有 5 個報告人,前面白老師主要講 NLP 和知識圖譜對接的工作,然後是三個做創投資料庫的公司的老總來給大家分享一下自己的經驗,最後是陳華鈞教授和丁力老師,來跟大家講一下開放知識圖譜的願景。
(更加精彩的論壇主題報告將於下周陸續發布,敬請關注)
推薦閱讀:
※中國大陸本土的FinTech發展路徑與模式(三)·大數據的應用
※大家都在說金融科技,怎麼沒人聊聊「投資科技」呢?
※證券投資及財富管理市場創新趨勢(2017年1季度)
※玖富證券:科技+互聯網的「智能金融」創新應用