人工智慧在金融領域有哪些應用場景和作用?
傳統金融如何利用數據?
所謂前事不忘後事之師,在了解 AI 對傳統金融行業帶來的影響之前,我們可以借鑒以往的經驗,看看傳統金融行業對現有數據的利用情況。
在過去的幾十年甚至百十年中,無數的銀行家,金融工程師,數據分析師,金融從業者為我們設計了很多非常便利方便的金融產品,比如信用卡業務,個人貸款業務,在這些產品迭代的過程中他們形成了非常嚴謹的迭代和風險控制的方案。
他們所利用數據的特點是針對這些金融產品業務區分能力強,但是覆蓋人群相對較低。
就如上圖所示的冰山,傳統金融行業對數據的利用率只有10%左右,而 Fintech 公司需要做的就是挖掘那些隱藏在冰山之下的數據,把金融產品帶給更廣泛的人群。
互聯網金融怎麼做?
隨著大數據解決方案的普及,我們可以搜集更多維度的數據來更精細的進行用戶畫像,包括利用一些行業數據,用戶的互聯網瀏覽數據,司法執行數據,第三方信用數據,出行數據,電商平台的交易數據,電話通訊數據和社交數據。這些數據的覆蓋人群會遠遠超過現有的金融行業所使用的數據。
而 AI 就是對這些數據進行組合,從而挖掘出有效的特徵。
如何利用好這些維度很高的數據,需要一個智能的解決方案。因為這些數據大多是非結構化的數據,可能來自郵件、視頻、文本、語音、點擊瀏覽行為、社交網路等多種渠道。數據的量級和清洗是一個重要的環節。
而大數據的一些解決方案為我們提供了較好的基礎設施。
關於 AI
在此之上人工智慧可以帶給我們大量的自動的規則學習,同時帶給我們更加強大的表達能力,而不僅僅是一些線性模型。當我們加入更多數據的時候,關於人的描述已經上升到更高維度的空間中,這時,我們就需要表達能力更強的模型,比如 GBDT 的模型,有幾千個有權重的子樹,比如深度學習網路,多層的神經元通過加工,自動抽取最優組合。
一個傳統的貸款業務可能需要2-3天來審批,而一個基於人工智慧模型的自動審批方案可能只需要幾秒鐘就可以完成。同時有些傳統風控模型的迭代周期可能要數個月甚至數年,但是人工智慧的模型迭代可以非常便捷和自動。
AI 所做的就是極大簡化這個過程,提高效率,同時可以大大提高模型驗證和迭代的速度。
AI in Dianrong
在點融,我們應用於風控的人工智慧解決方案主要有以下三個部分:
數據搜集和處理
風險控制和預測模型
信用評級和風險定價
便利可擴展的數據存儲和處理方案是重要的基礎架構。
各種非結構化數據到結構化數據的靈活轉換是保證應用的重要一環。
欺詐的識別是風險控制的第一步,如果利用第三方數據高準確度地識別一些有欺詐嫌疑的用戶是這一個環節需要解決的問題。
靈活地支持人工智慧的風控引擎和規則引擎是保證人工智慧應用的業務的重要工具。點融的規則引擎同時可以支持簡單的條件規則、也可以支持決策樹的規則,以及更加複雜的 GBDT 和深度神經網路模型。
通過知識圖譜我們可以將人群的關係更直接地映射到圖數據里,通過這些關係的遠近、和異常拓撲結構的識別,我們可以發現更多更深層次的風險模式,通過識別這些模式可以有效地減少團伙欺詐。
在風險級別識別和風險定價的模塊里。我們會結合三類打分板:專家打分板,傳統的邏輯回歸打分板以及人工智慧打分板在不同場景下針對用戶進行不同級別的人群劃分。針對不同級別的人群和不同產品的需求我們會試算出針對於該風險人群的定價。
我們點融也在積極地將人工智慧模型作為主要風控手段迭代改進自己的系統中。
同時我們也在應用深度學習解決一些業務冷啟動的問題。利用 transfer learning我們可以大大加快模型在新業務數據不足的情況下收斂的速度。
總結
最後引用薛貴榮博士的博客中一段話:
「基於實例的遷移學習的基本思想是,儘管輔助訓練數據和源訓練數據或多或少會有些不同,但是輔助訓練數據中應該還是會存在一部分比較適合用來訓練一個有效的分類模型,並且適應測試數據。於是,我們的目標就是從輔助訓練數據中找出那些適合測試數據的實例,並將這些實例遷移到源訓練數據的學習中去。」
推薦閱讀:
※港獨集會現一荒唐場景:警方清場 頭目逃的最快
※回憶張愛玲:翻開海量珍貴舊照,還原《傾城之戀》真實場景,看她輾轉的半島之緣
※只是偶爾在同一個場景會突然想起,是啊 那個人我曾經深愛過
※組圖:攝影師雪山頂上拍震撼場景
※家庭場景10-點心時間