金融語義分析的經驗與總結

文|王叢 本文發佈於2016年6月25日

2016年6月25日在文因互聯舉行了以「金融語義分析的經驗與總結」為主題的智能金融沙龍活動。參加沙龍的人員背景各不相同,有VC、 輿情分析師、研發工程師、學生等等。活動主要分為兩部分:文因互聯的CKO(首席知識官)——王叢主講了「金融語義分析的經驗與總結」;參會人員對目前金融語義分析狀況進行自由討論。

沙龍活動開始主講人王叢首先進行了自我介紹,並且介紹了自己職位名稱的來歷:CKO中 K 是「知識」(Knowledge),自己博士期間研究的是知識工程,文因互聯作為知識管理的公司,知識是很關鍵的,所以就叫CKO。由於文因互聯現階段產品需要用到語義分析的技術,所以王叢結合文因產品的發展歷程講述金融語義分析曾經走過的坑,又是怎麼跳過坑,發現前方的路,以期為後來人提供些許啟發。

文因搜索的入口是 wenyin.io

活動中王叢主要討論了為什麼將金融語義分析應用在新三板領域,以及金融語義搜索近期與遠期將會達到的目標。

首先,現階段新三板相對早期市場數據更公開可信,市場相對成熟;又與二級市場的邏輯的不同,依賴基本面分析不是交易數據,更能發揮語義處理技術的長處。其次是新三板增長速度快,得到政府強力扶植。

現階段存在的產品有一些傳統的金融客戶端,主要是依賴於PC端,數據全,但操作繁瑣笨重,思路更接近二級市場投資。我們的產品可以改善傳統的工作流程,節約人力時間成本,滿足用戶的產品需求。目前用戶的需求主要集中於上下游分析、競爭對手分析、企業亮點/風險點分析等,我們會做的是搜上下游、搜相近業務、搜股東減持等等深度分析。打個比方說,傳統金融客戶端是油田,我們則是化工廠,重點是加工和提煉。

金融語義搜索是個大問題,需要分幾個階段來完成。我們的近期目標就是提供關鍵的「碎片信息」,讓用戶可以做淺度的、但是傳統客戶端軟體很難完成的查詢,將反覆查詢的信息關聯、重用,將複雜查詢交給用戶完成。金融語義搜索遠期的目標是把邏輯推斷所需要的一切可能證據線索告訴用戶,以一種可交互的界面方式展現、幫助用戶進行探索,完成推斷。這也是文因互聯未來一到兩年的目標。

與會者進行熱烈討論

嘉賓:文因搜索與搜索引擎有什麼不同?

王叢:目前從外在形式來看是沒有多大的區別,但是不同的垂直領域就看你知識庫搭建的好不好,規則給的夠不夠準確,這樣再去提高準確率。其實我覺得搜索引擎差不多都是一樣的,只是不同的行業所設定的規則是不一樣的。但是往後會越來越不一樣,因為圖譜搜索搜的是「實體」而不是文檔,它知道你找的東西「是什麼」,不僅僅是看成字元串。

嘉賓:有沒有參考做輿情的公司?

王叢:這個其實有。我們現在的產品里也有一部分與情監控的內容,也和一些公司展開了 初步的合作。

嘉賓:但是工作方式還是很相似的,比如說把競爭對手以及自己的公司打造出二十幾個主題詞,把公司高管、競爭對手等這些統統的扔給輿情公司。輿情公司就是提供報告、金融資產分析、預警等,可以參考一下他們是怎麼做的。

王叢:這個肯定是會去做的,但是這要看在什麼階段去做。從技術上來思考的話,做輿情里的各種數據源分析,成本是非常高的。

有私募基金經理結合目前投資市場狀況對文因搜索產品提出了肯定,並問未來的意義是什麼?

鮑捷:傳統的FA(金融顧問)服務更多的是依賴金融經驗和人脈來服務,這就造成了FA沒有一個是長大了的。因為知識是在人的腦袋裡,他會覺得人脈明明在我這裡,憑什麼要為公司賺錢?所以會離開團隊,FA和VC都是這個樣子,這是傳統的方式決定了這種分裂。因為信息的不對稱是通過人來打破的,只有把這個東西用機器,至少是關鍵的部分用機器來承載之後,這種機構的成長性、成交的概率才能夠上漲。之所以這種經驗和人脈的方式制約了交易的達成,是因為當人一分裂時,那他所代表的交易平台也分裂了。我們知道一個市場上平台能提高交易的速率和成功率,是因為平台越大,消息越透明越容易。如果僅依賴經驗和人脈就很難。但是具體怎麼形成這樣的平台,需要一定的過程。不同背景出發的人會有不同的路徑,像已經有過撮合交易經驗的,他就會直接走撮合交易這一塊;而人脈熟的就會直接走社交這一塊;我們目前為止是走知識和智能這個路徑。中國市場這麼大不可能只有一家公司長大,一定是不同服務的渠道、對象上都會有一個不同服務方式的企業出現。各種方式最後都是有可能成功的。

推薦閱讀:

LBP (Local Binary Pattern) 是目前流行的模式識別、人臉識別演算法嗎?
向匯川學習,你的公司會更有力量
神奇的人造樹葉,可以隨時隨地製造出常見藥品
【腦洞故事集】二、EXE病毒

TAG:金融 | 人工智能 |