從大數據視角看智能投顧

前面幾篇文章討論智能投顧,由靠譜CFA們從專業角度解析基本原理或者探討人工智慧的影響。專業解讀之後,自然是從數據視角來看智能投顧。相比之下,數據視角解讀智能投顧會顯得生硬晦澀一些;但工程化思維具有天然的嚴謹和務實屬性,我們的目標是發現和解決一些實際的問題。

題目里用了大數據這個詞,不必糾結,在我理解下泛泛的大數據和數據已經是一回事了,有必要進行細分的是更具體的概念。日常工作所面對的大數據,已經逐漸褪去了炒作光環,進入低調、有內涵的落地應用發展階段。

當大數據從各方面都完成了鋪墊與試點,那關鍵問題就變成了如何從數據發現更多的知識,也就是銀行人工智慧應用發展的起點。

即便現在不智能,未來也是智能的

如之前CFA的文章所述,現在的智能投顧更多還是解決效率問題,而非智能的問題。換句話說,這個過程裡面smart的概念要大於intelligence,因此跟機器學習、人工智慧技術的關聯性相對較弱。當然,這與現階段面臨的主要問題有關,並且與數據積累和應用的層次也有關係。

雖然智能投顧產品宣傳中都會突出對新技術的應用,但究竟用什麼、怎麼用基本都是輕描淡寫。插個題外話,前幾天跟業務人員聊天,我說現在如果把機器學習這些名詞術語天天掛在嘴邊,但又說不出所以然,那會顯得很low。在微信討論群里這麼干會被人侮辱,在公開論壇裡面會被人攻擊,著實尷尬。

智能投顧終歸還是要智能化的,只不過需要一個過程,對應著數據應用層次與技術更新換代的過程。Fintech裡面有很多金礦,但核心矛盾的聚集之處都是大數據。對海量用戶數據進行探索和分析,找出數據潛在規律、揭示數據隱含信息的知識發現過程是數據挖掘。這個定義的關鍵是「潛在」、「隱含」,通過簡單的統計分析就能發現結果不是數據挖掘的過程。

來個粗暴點的定義,在銀行裡面只要涉及機器學習、複雜網路、自然語言處理這些技術的應用,都會包括數據挖掘的過程。這些技術的共同點就是以數據為中心,需要配套的數據治理、管理機制,代表DT時代的標誌。當業務對數據出現深層次的應用需求,那自然會應用到這些技術。當數據挖掘在投顧產品裡面發揮大腦的作用,那就實現了真正意義的「智能」投顧。

這是必然的趨勢,不過需要一個過程。

是否需要不一樣的智能投顧

有朋友看了之前文章後說現在智能投顧的產品雷同、乏味,需要做一些不一樣的產品。我說有道理,但要辯證的看待這個問題。

這兩年人工智慧很熱門,銀行內有經營壓力,外有國家戰略及諮詢的營銷,所以紛紛快速推出智能投顧產品。這些產品的外表自然差不多,基本原理、應用模式肯定也一樣,甚至連宣傳文案都可以模仿和改良。這是外在的必然相似,無需迴避。

那不一樣的地方在哪裡呢, 舉個栗子,很多手機在外觀上長的一樣,但工藝水準和生態體系還是略有差距。不同銀行的智能投顧產品,內在區別其實就是在客戶畫像、數據挖掘建模領域的能力。外在的部分都可以模仿,但內涵實際代表著自主研發能力,這才是差異化競爭的重點。

大數據需要時間、厚度的積累,數據挖掘能夠促進生態體系的健康發展,整體目標是數據價值的生生不息(growing strong)。

智能投顧產品,可以是表裡不一的典型。

人機融合的智能投顧

大數據普及的概念是數據挖掘,人工智慧普及的術語是機器學習;機器學習裡面「有監督」、「無監督」的概念也深入人心。

「有監督」比較好理解,其典型代表是信用評分模型,銀行裡面通常由風險部門負責。專業人員通過數據分析建模評分模型,對客戶風險狀況進行量化預測並應用到業務環節中。

「無監督」則相對晦澀,加上媒體炒作導致很多人對其有所誤解。除去傳統客戶分群的聚類,現在更專註在反欺詐等領域的應用。畢業論文是關於孤立點挖掘的主題,我的思路是監督、無監督、半監督一起上,通過一堆小論文攢成大論文。缺點是學術水平不能精益求精,優點是工程化能力有所提升。在反欺詐領域,根據場景不同、數據不同選擇合適的方法尤其重要,工程化以落地應用為目標導向。

當然,不管採用哪種方法,更重要的還是特徵工程。所謂的無監督特徵學習,在銀行大多數數據挖掘建模場景下並不存在。大師說過,「創造新的特徵是一件十分困難的事情,需要豐富的專業知識和大量的時間。機器學習應用的本質基本上就是特徵工程。」此外,模型孵化、落地實施、監控評價是保障模型有效性的關鍵環節,這些過程都是工匠化精神的著力點,並且需要數據科學人員與業務專家緊密協作。

智能投顧產品涉及客戶畫像和數據挖掘建模,這兩個過程都是人與技術充分結合的領域。現階段在模型應用的環節,也不能期待模型能徹底的代替業務規則。更加務實的思路是模型與規則的結合應用,這才是合理的選擇。

即便人工智慧,最終也未必是機器取代人,而是人機更好的融合。數據挖掘建模,是智能投顧實現人機融合的關鍵。


推薦閱讀:

14/50—將近一個月的R語言學習心路歷程
今日頭條年度盛典舉辦,中國娛樂行業進入大數據時代
大數據,大數據平台,大數據價值
今天,談談大數據。(2)
【博客存檔】拍拍貸風控預測比賽分享

TAG:智能投顾 | 大数据 | 金融科技 |