AI改變金融風控,深度學習技術可以將壞賬降低35% | 乾貨
昨天在風控群內,大家都在討論平安普惠COO的觀點,「在放貸領域,只有0和1的概念,要麼借要麼不借」,有人說,0和1的概念肯定不適用於貸款審批,信貸審批是多維評判的,沒有不能貸的客戶,只有不能貸的機制;也有人說,風險定價、風險補償機制就是用來在0和1之間進行調節的;而大家都認為,這個話題不能一概而論,要根據客戶的還款意願和還款能力去綜合考慮。
那麼,像信用卡一樣,只有0和1概念的企業是不是在風控技術上仍舊偏於落後,現在風控技術發展到了什麼階段?相信大家會在這篇文章中找到答案。
近期,在一次金融科技的分享沙龍上,創新工場人工智慧(AI)工程院副院長王詠剛表示,金融領域特別適合應用人工智慧,其像搜索引擎一樣擁有非常海量的數據。
「我們知道的一家銀行,其常用打分卡系統,那個系統是非常複雜的、由人設定的風險防控策略,這家銀行現在正在做深度學習切換的測試,比如說一半一半,那一半用傳統的做,一半用深度學習做風險防控,然後來比較壞賬率的差異,他們正在做內部測試的比較結果是,深度學習這邊的風控可以降低35%。」
用錢寶CEO焦可表示,「人工智慧在金融領域是特別好的應用,第一金融領域的數據量特別大,人是沒有辦法做全部評估,但是機器有很強的優勢。第二人有主觀因素,會疲勞,還有培訓,培訓起來很多的新人沒有經驗,你發現傳統銀行一個產品大概可能半年一年多改一次,我們風控模型每周都會改,機器也會學習,機器也沒有道德風險。」
創新工場王詠剛、晨興資本合伙人程宇、零壹財經CEO柏亮,以及創新工場和晨興資本投資的現金貸企業用錢寶CEO焦可參加了沙龍。清流消費金融在現場對核心要點做了記錄,以分享給讀者。
為了保持意思的完整性,清流消費金融對相關內容盡量完整轉述,並對重點部分進行加粗。
創新工場王詠剛:人工智慧正潛移默化地改變我們的生活
王詠剛:創新工場看的是人工智慧方面的投資和孵化,因為一直做技術方面的東西現在又在跟相關項目,所以跟大家分享一下我自己對人工智慧的理解,還有對人工智慧現在在這個行業裡面應用的一些想法。
不知道大家腦子裡想的人工智慧是什麼?前幾天那個master下棋,很有名,一共下了60盤棋60比0,我大概看了20多盤,我為什麼看?其實還是關心技術,其實關心阿爾法狗到底從去年到現在演進了什麼?
你們都用搜索引擎,搜索引擎是一二十年前的技術,一二十年前google就有pagerank,可是搜索引擎裡面的技術到底變化沒有,發生了什麼改變?
我給大家稍微解釋一下,曾經的搜索引擎裡面排這個結果順序的時候是按照一個公式排的,這個公式是人定的。
現在的搜索引擎不是這樣了,以前不是有很多參數嗎?以前不是有公式嗎?現在這個公式不見了,你就把這些你能收集到的、你覺得可能影響搜索結果排序的參數丟給電腦,讓電腦自己去學習出一個公式來,或者讓電腦自己去學習出一個模型來,我們數學上叫模型或者函數,這個函數是怎麼構造的模型?怎麼構造由電腦來決定,電腦憑什麼決定?就憑他學習的好壞來決定,壞就懲罰自己,好就獎勵自己。電腦學出一個模型,通常是幾千萬、上億的維度。人腦想不過來的這件事電腦可以,電腦可以在非常大的非常深奧的空間裡面完成這樣的學習任務,學出來的模型特別好的用在了搜索結果的排序裡面。
google搜索結果排序質量、百度的排序質量比以前有了很大的提高,外面的人看不到這裡面有一個換代性的變化,我們從曾經普通的搜索技術進入到了人工智慧的搜索技術,這是一個實實在在的變化,這個體現在每一個手機的主流應用程序裡面,如:今日頭條是怎麼根據你的興趣把那些消息推送給你的。
人工智慧真真實實應用在我們手機的每一個應用程序里,人工智慧對我們生活的改變是潛移默化的,不是阿爾法狗這樣的需要新聞報道。
創新工場王詠剛:深度學習技術可以將壞賬降低35%
王詠剛:比如我們今天是在討論用錢寶這樣一個,基於網上這種應用金融或者互聯網金融這樣一個小題目上來做。金融領域是特別適合應用人工智慧的地方,金融領域就像搜索引擎一樣擁有非常海量的數據,各種層面的數據,各種維度的數據,它也像搜索引擎一樣有非常客觀的評判標準對這種數據的應用結果,也有非常明確落地的場所。
金融領域風險控制叫風控,他們都看到所謂的真正深度學習真正的人工智可以幫助金融領域做這些事,這些事情上傳統銀行做的相對比較慢。像用錢寶這樣新興的企業創立的時候起,從創新工場考慮投資他們的時候就看到了他們是把技術放在第一位的,放在引領他們這個應用往前走,引領他們模式創新的第一位,人工智慧技術或者準確的說,現在的深度學習技術,可以在風控上面發揮非常大的價值。
剛才說的,以前風控是怎麼做?人去定規則,人會說這個人收入太低了有風險,人會說,這個人有犯罪記錄有風險,甚至會說這個人太玩遊戲有風險,但是再這樣說你能列出幾百個維度?幾百個了不得。機器完全是另外一種做法,你就把這些數據給機器,機器怎麼處理怎麼加工你不用管他,他的學習結果就是你以前積累的大數據,他判斷我這個對不對,不對就改進,越學越准。
我們叫黑盒現象,就像阿爾法狗一樣,你很難理解他這步棋,他最後結果是一定贏的,這就是阿爾法狗和今天要講的金融創新之間的關係一樣的,他們背後的技術是一樣的都是深度學習。
在深度學習這件事上,現在的金融企業、金融應用有非常多的發揮空間。我們跟創新工場的技術團隊,跟用錢寶技術團隊有非常多的交流,他們在同時的比較非常多不同的學習演算法,用於風控的標準演算法,他們會發現,實際上已經發現在現有的數據上基於深度學習的模型比所有的傳統模型要高出一截的準確率。這件事告訴我們真正的人工智慧,真正的深度學習,可能更多的情況下不是出現在普通人腦海里的機器人形象,所謂毀滅人類科幻小說的形象,更多的是實實在在的對手機上每一個應用程序對我們每一次的金融借貸所謂的網上交易一種實實在在的性能提升。
我們考察過一個公司,僅僅在一個銀行整個系統裡面的金融產品營銷這件事上做了一個把原來營銷的匹配模型換成了深度學習模型,銀行他通過種種渠道發送給客戶,這時候有一個效應轉化率,銀行可以收入這一百塊錢幫助廣告主投放廣告,所有投放廣告的產品,實際上我所有的廣告費裡面你深度學習能夠為我帶來的增長20%我就干,這是一個非常切實的收入也是非常好的例子。
另一個例子,我們知道的一家銀行,其常用打分卡系統,那個系統是非常複雜的、由人設定的風險防控策略,這家銀行現在正在做深度學習切換的測試,比如說一半一半,一半用傳統的做,一半用深度學習做風險防控,然後來比較壞賬率的差異,比較結果是深度學習這邊的風控可以降低35%。
用錢寶焦可:我們服務的人群絕大多數沒有強特徵
焦可:我們實際上做inside這套金融技術,用金融技術去服務一些以前沒有被服務到的人群,這個可能是我們很大的價值,接下來我跟大家分享一下我在這塊做的事,讓大家看看我們做的怎麼樣。
首先介紹一下市場,這個市場大家可能有點關注,因為很多人問,說什麼人會借一千塊錢,我前兩天看到一篇報道,我們這種新金融公司服務的客戶都是傳統銀行不服務的高危人群,其實12.3億不是高危人群。其實我們整個業務最大的機會來自於中國跟發達國家相比它的整個金融服務體系是非常弱的,我們知道信用卡4億張兩億人這樣的範圍,很多人沒有被傳統的金融機構服務到,而這些人群其實自己有很多經營需求,比如說很多年輕人,剛才回答那個問題,什麼人借一千塊錢?很簡單就是年輕人,我們講年輕人月光族,很多人年輕人自己花錢不算,經常花著花著就忘了。這是普遍的年輕人正常的行為習慣。
但是傳統的金融是服務不了這些人的。我們原來公司里有個20歲的小孩,跑到銀行里去借錢還開了工作證明,都是沒辦法辦信用卡,我們為什麼不服務這個人群?當然很多問題,很多朋友簡單的總結說這個比較懶效率比較低,這是一方面。
但是我覺得根本性的問題,底層的經營技術其實不支持,我不知道大家有沒有在銀行工作過,或者辦信用卡的經驗,大家都知道傳統銀行他往往怎麼做?你提交一個工作流水、工作證明社保或者六個月內或者一個月內水電煤氣帳單,讓你提供一大堆材料,這個材料每家銀行要的差不多,我們叫強迫症的風控,往往依賴幾項十幾項的特徵對人群進行風險,通過一大堆強特徵來做篩選,大家想篩選邏輯肯定不是特別有效的,所以大家會發現,金融裡面能夠服務的人群比較有限。
但是我們面對的人群絕大多數是沒有這種強特徵的,比如說服務業,比如說餐館很多從業者是發現金的他提供不了這個流水,也沒有社保,這些人基本排除了,但我們有一個觀點,這些人不是沒有數據,是沒有銀行要的冰山水面上的數據,這些人在水面下有大量的數據可以使用,有些數據一定是跟用戶相關,我們想可不可以不像商業銀行這樣通過幾個強特徵斷定你,銀行他評信用卡的技術是什麼?是yes/no,我們想看能不能通過弱特徵對人群進行精準定價。大家可以看到市場上的公司很多,絕大多數的一些傳統銀行的經驗往往是採用這種叫做依賴強特徵做一個引擎,我們做的方式從底層技術上不太一樣。
用錢寶焦可:通過率可以達到5倍,壞賬率低40%
焦可:簡單介紹一下我們的解決方案,這個產品比較簡單,用戶定位提到了,應該是覆蓋年輕人很重要的需求,這是我們前端,技術很重要。那我們的inside是什麼東西?我們整個的人工智慧風控分成三部分,第一部分是我們的特徵工程+機器學習,第二部分是大數據計算能力,第三部分是整個的業務體系。
我可以這麼說,我們公司做這些事情是沒有金融經驗的人參與的,很多公司說我們應該找一個老司機,但是我們要走一條沒有人走過的新路,我們這個業務里正好呈現了相反的態勢,我們在整個這套體系搭建裡面是沒有老司機的,都是一些技術人員用技術手段來解決這個問題。我簡單的解釋一下,我們發現很多特徵完全不在傳統風控人的經驗里,舉個例子我們發現說如果客戶的通話行為體現出非常強的單向性,經常給他人打電話別人不回,這種就會比有來有往的用戶逾期要高,這是老司機辦不到的,即使他能夠想到這一點他也很難做定性定量的判斷。
剛才王院長提到,其實人能想到的可能很多,但是絕大部分特徵,我們說這些特徵都是跟逾期率相關的,不相關的很多很多,比如說星座,星座跟逾期有沒有關係,其實是沒關的,這個其實就是我們很重要的一個工作,首先找到這些人有什麼特徵。
第二點其實很重要的一點,我們其實是做過很多機器學習的事情,如果用傳統的做法就是,人通過多年的經驗告訴你什麼樣的人是好人,什麼是壞人,但是你會發現其實我們都在學習,我們是通過每年放了幾百筆,到了下一年我看有沒有還,我是在學習。
這麼一想對了,我們怎麼學習,其實我們單月有3萬到4萬筆的sample回來,有沒有還,是逾期還了還是到期還了,大家想想傳統銀行的網點可能一個月幾百筆不錯了,這個數據量是完全不一樣。我們對應的三萬到四萬筆每筆都有特徵,人是學不過來的,本質上來講我們是用機器取代了人來去做這種學習。
反過來都是我們的,很有意思,柏老師也提到一點就是規模,我們不太一樣的一點,別人都在講我們放了幾個億我們更多講的是筆數,同樣一個金額我放了10萬筆,100萬筆,產生的數據不一樣,我們更關注的是通過樣本來進行學習。大家看到這兩個東西好像很好理解,這兩頁其實也很考我們的能力,本身大家想想人看的話就看死掉了,我們現在一個用戶提交以後整個的機器決策只需要8秒鐘,我剛才舉例星座,把星座扔到模型里做迭代我可以15分鐘內知道這個用戶,這個特徵通過機器來看有沒有用,能佔多少壞賬,早期我們做這件事情要兩天,那時候的量值是1%,現在我們量值增加了一百倍。
所以說其實整套是我們在做的一些事情,其實比較好理解,沒有那麼複雜。找到那些點通過機器的學習看哪些點有用,我們搭了這樣一套大數據計算的儀器。大家可能看到跟很多產生的金融公司講他怎麼做風控,其實完全不太一樣,回答偌馨剛才的問題,就是說首先結果來看,因為這個我們也會有一些競品的數據,通過機器來去做這套東西的結果,我們看到競品的數據,我們的通過率可以達到他們的5倍,同時我的壞賬率比他們低40%,我們不僅是風控效果明顯提高,通過率也提高,其實人工智慧在金融領域是特別好的,比如說數據化程度你的樣本,我們也是看到了人工智慧在整個的這塊領域,第一它的數據量特別大,人是沒有辦法做的,但是機器有很強的優勢。
第二因為人有主觀因素,那麼可能覺得自己不太安全有他的問題,人會疲勞,還有培訓,培訓起來很多的新人沒有經驗,你發現傳統銀行一個產品大綱可能半年一年多改一次,我們現在每周都會改,機器也會學習,機器也沒有道德風險,經常看到市面上什麼攻略教學學習哪來的?就是機器告訴你公司是怎麼審的,這樣的話一千多個特徵的人怎麼追尋很難找到,機器很快,我們整個實習期間也在做業務,機器在不停的跑,右邊舉了我們覺得還不錯的效果,很重要的是技術典型的問題,我覺得這是一個很重要的點。
那麼回到一個業務量上面來講的話,其實剛才提到大家可以看到我們過去增速是很快的,其實是這樣的,剛才柏老師提到說這是一個沒有人做的領域,其實我們做這個業務之前很多公司已經做了很多年了,為什麼有人問用錢寶一年多做到行業的第一名一百多萬單這個量級,是不是他們人膽大?
我們其實更多的依賴是我們剛才談到的那些技術。大家可以看到我們的增速在這,這個裡面很重要的點,很多金融領域容易劣幣驅逐良幣分散,p2p幾千家,現在這個領域也有一些新的player,這個業務領域其實很強大的規模效益。我們現在的業務量是全行業最高的,第一個是我們有更多的樣本,上個月有一百萬個sample回來,相當於有一百萬個material feed回我的model。整個獲客成本壞賬率都會比別人低,還有更多投入市場。這個月,這個過程是別人沒有辦法做的,你的樣本越多模型風控力越強。
其實在這個業務裡面,如果是以技術為核心,這個公司未來的增速會越來越快,這是我們對這個業務的理解。
我覺得我們現在這個業務本身,我自己做的事情是很新的金融技術,我們有一個粗淺的觀點,傳統金融是少數人金融,如果想改變這一點其實就是需要靠新的金融技術,這家公司真正做的事情是新的金融技術,我們也不太懂這個傳統怎麼去人工專家的經驗,人工學習,我們不想做,我們想做的事情是通過機器告訴我們,機器挖掘,機器學習,機器審核,去服務這些underbank的人群。
剛才也提到這個問題,為什麼這些人不服務,這個一定要搞清楚,我們對這個事情的解釋是因為傳統金融的風控技術不適應這個人群,我們想發展出一套基於這個新金融人群的技術,這個技術上我們提出更多滿足這個技術的產品。
我們想服務更多人,我們想讓每個人有所求,其實一個互聯網公司在比較早期的時候有個原始的衝動,我們覺得一個搜索引擎可以幫助偏遠山區的小孩能夠像大城市的小孩一樣,這是搜索引擎帶來的價值,其實我覺得一樣,如果我們銀行像傳統的網點,或者仍然採用那種規則,其實你很難打破現在的框框架架真正解決這個問題,為市場提供更智慧的金融解決方案,讓每個人都能享受到這一點,享受到金融的紅利,這是我們的想法,好,謝謝大家。
關注微信公眾號清流消費金融(ID:iConFin)可入群。
推薦閱讀:
※想寫一個機器學習類的五子棋,可能么?可能的話需要看什麼書,參考什麼,求指點
※2017 年度 AI 和深度學習大事件回顧
※目前,主流的人工智慧機器翻譯團隊在近一年內主要突破和攻關的技術方向是?
※自然語言處理有哪些商用進展?