小議銀行人工智慧的基本打開方式

近期參加了若干內外部交流,頗感銀行大數據應用潛力無限。只要有數據,大家都會想著去發揮數據價值,利用數據分析挖掘來做點有意思的事情。想要充分實現這些想法或需求,數據、平台、人才、機制這些基本因素必不可少,都還有大量的工作需要去做;這些就留著後面慢慢去總結和分享吧,先簡單談一下人工智慧在銀行的基本打開方式。

從大數據聊到人工智慧,這是很自然的事情。人工智慧的火熱,直接加速了大數據應用向著深層次、體系化方向發展。概念似乎普及人心,但問題也隨之而來。一堆專業術語,即便科班出身也不容易講清楚具體的界限分隔,對於很多數人來說就有點盲人摸象的感覺了,人云亦云的情況也在所難免。

於是就想「小議」一下這個主題,闡述一點基本的想法和思路。內容相對簡單,目標是當我們討論銀行人工智慧的時候,期望能有個大致的框架作為基礎;免得在不同的平面進行交流,各說各話等於浪費時間,畢竟效率是人工智慧的一大優勢。

人工智慧的強與弱

去年談論人工智慧的時候,很多人會聯想到科幻電影裡面的場景,比如駭客帝國、太空漫遊2001、終結者、機械姬,還有Wall-E也算,這些都屬於強人工智慧。簡單的說,就是機器實現大腦的若干重要功能,包括思考和推理能力。如果能夠到達這個水準,那硅基的機器顯然會完勝碳基的人類;當然這是很複雜的事情,可能需要多項領域的技術突破作為基礎,應該不會太快。所以銀行討論人工智慧的時候,肯定不是強人工智慧,太超前了。

與此對應,弱人工智慧是能製造出能真正地推理和解決問題的智能機器,這些機器只不過看起來像是智能的,但是並不真正擁有智能,也不會有自主意識。這個定義來自維基百科和百度百科,翻譯一下,就是我們設定好演算法給機器運行,輸入數據後運行演算法,然後輸出一個貌似「思考」後的結果。很熟悉的感覺吧,對了,就是機器學習的基本原理,同時也屬於數據挖掘的過程。

銀行發展人工智慧自然屬於弱人工智慧的範疇,數據挖掘是關鍵的能力要求,機器學習是重要的技術標誌。

src: slideshare.net/KimKylle

機器學習的深與淺

目前頂級人工智慧產品都屬於弱人工智慧這一類,這些產品裡面深度學習發揮了重要的作用。在銀行討論人工智慧的時候,有一種普遍的看法就是人工智慧必須與深度學習關聯,深度學習才是人工智慧應用的基本標誌。其實人工智慧已經潮起潮落好幾輪了,不過恰好這一輪的崛起與深度學習緊密關聯。

Slide by Andrew Ng, all rights reserved.

看一下深度學習的優勢:對比(shallow)機器學習演算法,深度學習的性能隨著數據量的增大而線性提升,其他演算法的性能在達到一定程度後保持水平狀態。當然,現在有新的文章認為在小數據集上深度學習依然能夠發揮效果,但對於銀行來說這不是重點的事情。以交易數據為主體的應用中,基本上前面那段上升曲線就夠用了,比如風控或營銷。

如果嚴格以深度學習作為標誌,那可以確定目前銀行基本沒有人工智慧應用了。實際上我們都知道數據挖掘可以應用到銀行的多個領域,但多數場景下邏輯回歸演算法的效果就不錯了,支持向量機和梯度提升決策樹能夠進一步提升模型性能。因此銀行人工智慧應用如果非要選擇技術標誌,也應該放大到機器學習層面:將機器學習應用於銀行的弱人工智慧產品,用機器模擬實現人腦的部分能力。

針對實際落地場景,成本因素是必須考慮的,還有模型的可解釋性,以及系統落地的便捷性。在學習演算法的深與淺的選擇上,複雜的模型未必會有更好的效果,多數情況下特徵的加工處理似乎更加重要。綜合這些因素,即便實際時間序列預測模型中LSTM表現更好,我也傾向使用稍微差一點的SVM。SVM速度快,落地部署方便,只需要一個Jar包就可以了,上LSTM的話搞不好還要過一下架構評審。

其實呢,銀行發展人工智慧應用未必需要用深度學習作為技術標誌,或者說壓根也不需要從技術角度確定標準,而是要看人工智慧可以給銀行帶來什麼。

受影響的兩種類型工作

銀行是最喜歡擁抱高科技的傳統行業之一,在競爭激烈的環境下逐步應用人工智慧技術顯然勢在必行。歸納一下,受這個過程影響最大的主要涉及兩種類型的工作。

第一類,對於員工能短時間內做出決策的事情,在新型機器學習技術支持下會做的更快更好,大量機械重複性的手工操作環節能夠被機器替代。銀行信貸審批流程中包括這種類型的工作,甚至佔用了員工很大的精力,自動化和智能化的目標是提高效率。運營管理條線中這種操作環節更多,網點智能化的過程能夠幫助櫃員有時間和精力去與客戶做更深層次的交流。

第二類,對於員工無法輕易做出決策的事情,比如風控或反欺詐;這種情況下的人工智慧應用能夠發揮的作用更大,但技術上就不那麼容易了。這種類型的銀行人工智慧應用,自然是從大數據視角切入,綜合機器學習、社交網路分析等技術構建數據挖掘模型。相比之下這種類型的應用更不容易被複制,對應真正的技術實力。

銀行發展人工智慧的過程中,應該著重考慮技術能夠解決什麼問題和帶來哪些業務提升,在充分研究需求的基礎上再通過技術創新實現升維打擊,從而贏得同業競爭力。這種情況下,還可以考慮一下增強智能(Augmented Intelligence)的概念,這時AI的意義在於幫助企業提高效率或節約成本,而非真正實現人類的智慧。

技術創新與升維攻擊

在銀行大數據應用發展中,複雜網路是一項神奇的技術,被廣泛應用到反欺詐、反洗錢、反舞弊領域,當然還有營銷和客戶管理等。不同的背景下有不同的叫法,諸如社交網路、知識圖譜等專業術語,在銀行實際應用中其實基本上是一碼事。

複雜網路分析能夠成功應用到風控等領域的原理比較清晰,就是從更多視角洞察客戶特點。多維度的分析能夠發現傳統方式看不到的問題,相比之下有點降維的感覺,自然會有更好的效果。實際上銀行反欺詐面臨的形勢也越來越嚴峻,反欺詐能力也必須進行對應的升維,畢竟魔高一尺、道高一丈。

之前有討論過客戶的特徵刻畫,靜態屬性、交易屬性、社交網路之外,還有更深層次的情緒屬性、價值觀屬性、道德屬性等內容,這對應著從數據採集到深層次應用的完整流程,也對應著更高維度的攻擊力量。升維攻擊對應著多來源數據的採集與豐富,還有機器學習、複雜網路、自然語言處理、機器視覺、語音識別等技術的綜合應用。

關於技術組合,在實際應用中我們嘗試過將複雜網路與機器學習技術進行結合以提升風控模型的預測效果。後續也會嘗試與深度學習的結合,旨在適應更加複雜的多渠道綜合反欺詐需求。當然這裡有個基本原則,就是以解決實際問題為導向選擇最適合的技術,如無必要不會使用複雜的演算法。

最後,大數據與人工智慧的結合,伴隨著高新技術的持續研究與應用,也對應著銀行數字化轉型的必經之路。

歡迎交流,共同進步。


推薦閱讀:

在人工智慧和機器學習領域中國和國外存在哪些差距?有多大?
管住嘴、邁開腿,智能手環教你動起來
跨界大師:人工智慧人物譜(三)
斯坦福發布人工智慧百年報告,預測AI如何在2030年改變人類的生活

TAG:人工智能 | 金融科技 | 大数据 |