螞蟻金服漆遠:AI如何應用於金融服務 | 北大AI公開課實錄
主講人:漆遠 | 螞蟻金服副總裁
屈鑫 編輯整理量子位 出品 | 公眾號 QbitAI
3月7日,北京大學「人工智慧前沿與產業趨勢」第二講。本期主講嘉賓為螞蟻金服副總裁漆遠,他的授課主題為:《人工智慧與金融服務》,有技術、有舉例,自然也有不少乾貨。
值得一提的還有課後討論環節,北大人工智慧創新中心主任雷鳴,還與漆遠就未來AI在金融中的應用發展、突破等問題進行了探討,問答都很精彩。
量子位作為獨家合作媒體,為大家帶來本期乾貨整理。
主講嘉賓:漆遠,螞蟻金服副總裁、螞蟻金服首席數據科學家。國家千人計劃特聘專家。2005年獲得MIT博士,並在MIT計算機與人工智慧實驗室進行博士後研究工作,受聘普渡大學計算機系和統計系終身教授。
2013年回國加入阿里巴巴,任職集團副總裁,與王堅一同領導創建iDST(阿里數據科學與技術研究院)。目前是機器學習權威雜誌Journal of Machine Learning Research的執行編輯及機器學習會議ICML的領域主席,並獲得微軟牛頓研究獎和美國科學基金NSF Career獎。
以下為漆遠博士分享實錄整理:
金融服務的基本挑戰
今天跟大家主要分享一下螞蟻金服目前在AI技術上的一些思考和發展。
我覺得今年是一個很好的時間點,大家能有更多的思考,帶來更多的來落地和更深入地去發展技術。所以我們介紹一下人工智慧,在螞蟻金服和阿里的一些發展。
提到螞蟻金服,在去年大家普遍的理解是:螞蟻金服一個金融服務公司。其實螞蟻金服有著AI的金融應用場景,其中也產生了很多有意義的問題和挑戰。
這些場景的數據是AI產生的一個重要的源泉。那不同的數據怎麼來產生價值,怎麼利用數據,開發出更多的價值?這裡邊有很多挑戰,比如時間的敏感性,一個交易,需要在毫秒級內作出判斷,這裡就牽涉到很多機器學習問題。
還有大家熟知的餘額寶,其實這一切產品的背後,都有風險控制的需求,有信用的需求,我們怎麼能夠從不同的角度,把數據綜合來看,產生更多的價值或更安全的系統,那這是非常有意思的問題。
另外一個方面是安全,還有系統性風險,有時候整個系統本身會產生風險。怎麼從一個系統的角度來考慮,這個問題非常關鍵。
我們提出了一個「金融大腦」的概念,簡單來說就是做出了一個強有力的金融平台。它有幾個核心的功能:風控信用決策、降低服務成本和提升服務體驗。
做金融智能的核心是安全,所以螞蟻金服做了很多安全上的考慮。我們開發的金融智能平台裡面涵蓋了很多演算法,下面介紹一些具體的例子。
系統安全
怎麼能夠保證系統安全性是非常關鍵的問題。
第一個關於系統安全性檢測,我們採用了弱監督學習的技術,主要是用於發現潛在威脅和提升攻擊檢測。這個技術的上線效果非常好,螞蟻金服出了一系列的文章來詳細介紹弱監督學習。
反洗錢
另外一個很大的問題是反洗錢,怎麼通過機器學習的角度,自動地系統化地來學習,是非常有意思的一個問題。所以我們建立了反洗錢模型,用的是無監督或者弱監督圖演算法,用於資金交易網路特徵挖掘和無監督隱案挖掘。這都用到了真實的這案例中。
垃圾賬戶識別
舉一個具體化的例子:垃圾賬戶識別。垃圾賬戶註冊防控能夠降低後端風險基數,穩定大盤指標,極大地提高整體的賬戶質量。控制垃圾賬戶的註冊,確定賬戶是一個真實的有效的賬戶,是一個很關鍵的問題。
對於新註冊用戶,怎麼來判定這是不是一個垃圾用戶?我們的想法是從系統的角度來考慮人和這個社會之間的關聯,然後構造網路,從網路結構來思考,一個人的信息不會很多,那麼可以借整個網路的信息來一起分析。具體來講就是組裡老師開發了一個叫Struc2vec的演算法,核心思想非常簡單:把網路和深度學習結合起來。
Struc2vec演算法的規則,很好地平衡了預測準確率和預測召回率。基本上是在90%的召回率情況下,準確率也基本能達到90%左右。
說明這個演算法有非常強的區分能力,能夠比較準確地區分一個賬號的好壞,同時和經典的規則以及Node2vec比較,預測召回率也有所提升。
智能營銷
再說一下智能營銷中的應用。很多公司都有增長用戶的需求,那怎麼來促進增長?平台怎麼把商家和用戶連接起來,那是非常關鍵的一個問題。
這裡面我們就考慮到強化學習和加強學習,它的核心思想是:把現實的決策問題,放在數學的框架下來考慮。它的優勢是能精準刻畫用戶狀態、多渠道組合決策和全人群差異化決策。
去年提過,深度學習有一個非常大的提升,現在比深度學習的方法又有了一個很大的提升。在推薦卡片點擊率上,實時深度強化模型較深度學習提升了70%;在最終簽約率上,提升了50%。
再講另外一個跟營銷相關的問題。在現實生活中,大家可以看到不同的信息,那能不能把所有的信息源融合在一起?也就是怎麼把信息融合在一起,使我們能看到更全面的細信息,來幫助更加精準地理解和判斷。在金融的場景里,怎麼把不同的行為結合起來。
這是非常有意思的一個問題。在這上面也可以理解為把很多數據源都接進來,然後在隱含空間裡面把數據做一個綜合,用統一的框架來表示。
舉個真實的例子。看右邊這張圖,大家看到什麼共同的特徵?是很多穿著緊身牛仔褲的年輕女孩子,分析這個行為,發現買緊身牛仔褲的女孩,較其他人,買手機碎屏的服務的概率比較高。
於是我們就開發了叫做「碎屏險」的產品,這是非常小但很創新的產品,我們做推薦的人群就是左圖這群人。
還有非常多類似的事情,一旦發現數據間的強關聯之後,就能用很多應用來解決一些小的問題。
保險
舉一個定損寶的例子。
大家非常熟悉的是人臉識別,換一個場景,把計算機識別應用在這個車上。看到一輛車,我們目標是判斷這車裡哪裡有問題,如果撞車,損失的價格是多少。
那麼首先要知道哪些地方有問題,所以我們要識別每一個部件,這是經典的計算機視覺的問題。識別完之後,還要判斷有沒有問題。同時還要處理很多噪音的問題。
定損寶的決策是全鏈路深度學習,先將噪音去除進行類目識別,基於目標檢測進行原因判斷,程度判斷,對目標分割進行多圖融合,再生成決策。
從金融大腦到智能助理
除了剛才提到的在保險的應用之外,金融大腦本身還用在了金融信息服務里。
其中一個是智能助理。在螞蟻金服里,智能助理起源於智能客服。螞蟻金服業務發展太快,客戶需求一直很高,必須要考慮使用智能客服,後來就考慮應用了人工智慧。
客服機器人演算法上是應用了結合用戶行為軌跡的語義匹配模型。現在其實機器能解決大部分問題,但是在特別疑難的,很重要的大問題上,我們還是保證質量,機器人無法回答。
現在我們想推出一個機器人,它能夠進行多輪對話,有整體的系統的智能。通過自然語言處理和機器學習的能力,向一系列場景:從買機票,買火車票到發紅包,甚至醫院挂號等場景都提供服務。
金融智能平台
前面講了很多AI的具體應用,但真正背後它們都依賴一個非常關鍵的東西:平台。能夠非常快地處理海量的數據,然後分析作出預測,這就是金融智能平台。
金融智能平台核心的第一條是安全。另外兩個是實時性和大規模。
AB測試
從一個系統的角度來講,一個策略要關心它從上線到下線,中間產生了什麼效果,怎麼保證它的效果?它是不是有問題?這裡面一個方法叫做AB測試。我們把這個法,用在了金融的服務裡面。AB測試是一個簡單的因果分析的工具,用這個東西,和不用這個東西,比較來看它的效果。所以這是一個科學決策機制。
雷鳴對話漆遠
AI應用於金融,是不是有什麼風險?我們會用什麼方法去盡量避免這些風險?
在過去幾年裡面很多人,包括AI的研究人員都特別注意,我們不希望真的有一天我們的生活,從遙遠的未來來講,真的被AI控制。就目前而言,我覺得我們到那一天的距離和其他能看到的直接的危險還是比較小的,當然也有可能越是做這行的越沒有意識到的風險。我們知道太多AI無法做到的事情,所以我們覺得到那一天今天我們技術本身還需要非常大的突破。
說一下近距離的風險。比如股市的突然波動。從幾個方面來說一下風險:第一個叫演算法的可解釋性。要避免災難,首先要理解它,理解這個決定是怎麼做出來的。而今天很多深度學習系統,處理的數據是上億的,人很難判斷它核心什麼變數的哪些變數哪些變數組合導致了我最後這個決定。
第二條是不確定性。很多決定做的是非常肯定的,有的決定做出來其實不肯定的。從決策論的角度來講,那就有一個這個非常大的風險在裡面。可喜的是還有很多的補救方法,大家可以考慮其他的方案,使決策更合理。
第三點是AI的系統風險。假如有很多AI系統同時在跑,他們其實可能會產生一種叫做系統性的風險。這個風險也是非常非常關鍵的,尤其在金融系統裡邊,這個是群體性的問題。
過去一年裡,螞蟻金服有哪些技術應用取得了一些進展,未來會有哪些技術在金融上取得突破?
去年的話,大家首先想到了深度學習。在金融裡面第一大區域是風控,風控裡面的只有很少的數據是有標註的,所以去年我們開發了弱監督學習演算法,用在了風控裡面。
這是業界就我個人所知,第一個使用這種演算法。
然後在以後,我覺得對不確定性和解釋性會更加關注。簡單來說就是萬一出了什麼風險,我需要知道是怎麼發生的。知道之後,預防它,不讓它發生,這個非常關鍵。
對於學生來說,準備投身到金融領域,大家應該在哪些領域打好基礎,為將來做更好的準備?
第一,我覺得金融領域特別適合機器學習,包括泛金融行業,都是關於數據,關於計算。
第二個說怎麼準備,我覺得如果大家對金融感興趣,可以學習的金融的基礎知識,同時把這個人工智慧它核心的一些東西學好。人工智慧它本身是一個非常跨學科的學科,比如說統計;優化,怎麼來做優化;應用數學,包括物理的很多東西和機器學習有很多相關性。鼓勵大家多學一些東西。
未來AI可能在金融行業哪些領域有大的突破?或者說對社會進步會真正落地,真正公開,真正有用?
這個確實不好回答,因為這個問題是講商業的問題。AI很多應用在沒有產品化之前,C端的用戶並不能體會到,並不知道每筆交易背後有AI演算法。
另外我覺得是投資本身。大家以前做演算法交易,主要靠高頻交易,那高頻交易肯定不是螞蟻金服的使命,我們也不做這個東西,那我們做金融信息服務,我們怎麼能夠把信息提取出來,幫助做決策做的更快,然後服務管理資深的用戶做更理智的決策。
從技術到應用,還是一個不斷探索和捕捉的過程。技術跟應用結合過程中,什麼時機比較成熟,有時候回頭看有必然性,但是往前看的時候感覺什麼都是偶然的,所以我覺得去多做一些探索。
對於創業企業,它在往前走的過程中,能有一些什麼樣的方式、方法避開這些大公司的鋒芒,去比較好地建立起自己企業的優勢呢?你有什麼想法?
首先說一下,這個不是我擅長,我就講一講我自己的一個體會吧。第一個觀點:拿技術來獲取數據得交換,為什麼給你數據?因為我為他產生價值,我能為他產生價值,產生有用的東西。就說如果大家的技術特別牛,那找到一個痛點,從痛點出發,技術能不能產生這種所謂技術服務,然後產生數據。
第二個我想說的是,考慮其他的因素,考慮新的技術。社會本身是最大數據的來源。
第三個,是自己的一個設想:在新的架構下,未來可能產生新的獲取數據的機制。
對區塊鏈這一塊,就個人觀點談談這個事情吧,你對新概念大概是一種什麼樣的觀點?對它的技術層面,包括說未來應用發展這一塊有什麼樣的想法?
區塊鏈我其實關注了好幾年,但是我並不是這個區塊鏈專家,也沒有專業做區塊鏈。回看歷史來理解,區塊鏈的話,我覺得像互聯網一樣,會產生一個新的大的改變,對社會機制的改變。它產生了一個新型的機制,使大家能夠不需要一個中心化的東西。區塊鏈技術還在早期,還有很多機會。
下期預告
下期北京大學「人工智慧前沿與產業趨勢」第三講,將由曠視科技曠視研究院首席科學家孫劍,帶來關於計算機視覺如何應用與落地的相關分享。關注微信公眾號「機器學習研究會」可獲取參與方式。
祝大家聽課愉快~
學習資料
在量子位微信公眾號(QbitAI)界面回復:「180309」,可獲取本次課程的視頻回放鏈接。
— 完 —
歡迎大家關注我們的專欄:量子位 - 知乎專欄
誠摯招聘
量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復「招聘」兩個字。
量子位 QbitAI · 頭條號簽約作者
?? ? 追蹤AI技術和產品新動態
推薦閱讀:
※利用AWS學習深度學習 For Udacity P5(第二篇:AWS 註冊)
※AlphaGo背後的秘密!解讀谷歌全面重磅開放的雲TPU
※智能行業如何發展?
※AI大事件丨OpenAI啟動Research2.0,AI破譯怪異古老手稿
※淺談自然語言處理 –前言