桃樹科技TaoData完成A輪融資:專註「量產」數據科學家

2017年2月,由光信資本領投,創新工場、線性資本、界石投資及頭頭是道跟投,其中創新工場更是超額跟投,桃樹科技(TaoData)完成了A輪融資——這家以估值迅速增長聞名於業內的科技公司,在邁向人工智慧獨角獸的路上一騎絕塵。

l 桃樹科技成立於2016年4月,於2016年5月獲得線性資本、滴滴出行天使投資人王剛及同盾科技天使投資。

l 2016年10月,桃樹科技獲得創新工場、界石投資、線性資本及滴滴出行天使投資人王剛pre-A輪投資。

l 2017年2月,由光信資本領投,創新工場、線性資本、界石投資及頭頭是道跟投,其中創新工場超額跟投,桃樹完成A輪融資。

桃樹科技創始人楊滔的身上,有著許多亮眼的標籤:

求學時期,是紐西蘭高考全國優秀畢業生,博士生導師口裡最優秀的博士學生,以創歷史的速度完成博士學業。

從學術圈轉戰業界,被上司喻為業內頂尖的數據科學家,建立淘寶數據科學團隊,首創聚划算爆款模型。

從淘寶數據科學家到創業者,又一次勇敢的轉身,棄下以往所有的榮譽和光環,踏上艱險新征程。

終點即是起點

「做出通用的數據科學產品,讓繁瑣的數據科學流程最簡化。」是楊滔創業的初心。

創業最初的一段時間,楊滔做的最多的一件事,就是獨自對著電腦閉關寫代碼。

在這關鍵的幾個月,他用代碼創造了一個又一個桃樹機器人的雛形。當這些初級版桃樹機器人應用在銀行風控及精準營銷項目後,效果斐然,項目周期從之前的半年縮短到了兩周,同時模型效率顯著提升。

然而,隨著銀行客戶不斷增多,項目經驗越發深厚,楊滔很快發現最初設想的不足——「通用的數據科學產品」不應該是也不可能是數據科學家自己對著電腦設計出來的。

沒有對客戶需求的準確把握以及各行業業務專家的知識輸入,所謂的「通用」僅局限於客戶需求的淺層,無法產生顛覆性價值。

又一次放下,再一次啟程。雖然此時桃樹已有近20人的團隊,這位一直以技術為刀劍闖蕩江湖的數據科學家,決定背起電腦包,穿上運動鞋:回訪核心客戶、與業內專家溝通學習、深度參與項目進程……馬不停蹄。

在矛盾中前進

「從應用入手,先以客戶的需求為重點為客戶創造價值,才是現階段數據科學正真應用的方向。」楊滔不破不立的性格,被最大化的發揮在他創業之路上。

從通用數據科學產品到數據科學家深度參與的數據科學服務,看似背道而馳的兩個方向,桃樹說變就變。

新方向明確後,桃樹團隊將項目重點從技術研發轉向深挖客戶需求,從中提煉了桃樹數據科學解決方案的關鍵——客戶價值管理體系。

如今,桃樹團隊已將桃樹數據科學解決方案已成功應用於金融行業,幫助多家知名企業建立客戶價值管理體系(CVM)。

CVM是桃樹科技服務企業的數據應用體系。這些應用點本身是最大化客戶價值的完整閉環。

楊滔認為大數據企業服務的最終商業模式是「解決方案」服務。然而,大數據的解決方案服務並不是傳統的諮詢模式,而是「諮詢+產品」的組合模式。

以桃樹風控模型為例,其可以幫助銀行信用卡中心審批帶來的壞賬率大幅度下降。然而,影響信用卡業務目標的不僅包括客戶的壞賬率,那些高價值客戶可能有良好的信用,但可能選擇競爭對手的消費信貸產品。因此,有經驗的數據科學家會將客戶流失預警模型與風控模型組合使用,最大化信用卡業務價值。

而在金融產品的營銷中,首先需要找到適合該場景的營銷人群,這需要精準營銷模型。然而,即便精準營銷模型再準確,仍然需要在合適的人群中為不同個體客戶提供個性化產品推薦。精準營銷模型用於篩選人群,個性化推薦模型用於為不同客戶提供產品組合,二者的組合使用才可以最大化營銷效率。

在桃樹服務的企業客戶中,許多企業最關注的並不是幾個具體的應用,而是從基礎層面了解客戶信息。

企業不僅需要控制風險,更需要認識發生壞賬風險最高的人群是否有共性,是否能從決策層面系統性規避高風險客戶群體。企業不僅需要精準營銷,更需要從客戶特徵中挖掘核心客戶的人群畫像,以及需要營銷產品和其他產品或者場景之間的「關聯營銷規律」。企業不僅需要挽留高價值客戶,更需要認識是什麼造成了客戶的流失以及挽回客戶的核心手段。

不僅如此,企業決策者需要自動從客戶群體中挖掘那些對業務價值貢獻最高,並且具備共性的人群特徵,從而以更高效率找到業務的整體定位。

快速試錯,小步快跑,不斷逼近目標,是楊滔一貫的做事風格。當很多人還在糾結觀望祈求完美的時候,他往往已經開始行動。

DataBrain

人與機器的關係,在挫折與矛盾中上升:

當通用的機器學習產品無法深入客戶需求時,數據科學家便是機器的老師,告訴機器哪些才是真正需要被關注及解決的問題;

當數據科學家的精力被大量的低級腦力勞動佔據,機器便是人類最忠實的助手,不知疲倦的運作直至完成任務。

桃樹正是在不斷探索人與機器的矛盾與協作中,倔強成長:

最初的「通用化數據科學產品」構想被現實擊碎,碎片散落到一個個定製化的數據科學服務——信用風控、精準營銷、個性化推薦、客戶分群,最終匯聚成客戶價值管理體系。

桃樹數據科學七劍體系的建立,將數據科學最核心的工作流固化,劍指諮詢服務無法批量化複製的商業局限。從問題定義,到數據準備,演算法調優,知識發現,效果分析,線上部署,模型更新,桃樹數據科學七劍的核心價值是抽象了從數據到商業價值的核心環節。

無論創業的每一天是多麼的分秒不懈,這「七劍」的每一篇文章每一個環節每一個字,都是楊滔精心設計編著而成。因為他堅信,當數據科學七劍被充分實現,桃樹「人人都可以成為數據科學家」的使命便可以最終落地。

當為客戶創造實際價值的諮詢服務工作流可固化後,數據科學的核心技術也在逐漸沉澱成型。

桃樹數據建模平台DataBrain,正是桃樹核心技術沉澱而成的產品。DataBrain集「特徵發現」、「特徵工程自動化」、「演算法調優」及「知識發現」等最精尖的數據科學技術為一體。

山重水複,DataBrain又重新突出了「通用化產品」的概念,但是內涵與之前已全然不同。基於客戶成功案例的技術升級,讓人工智慧技術從理論趨勢真正落地應用。桃樹的目標,是將DataBrain做成數據科學的基礎設施。

在上一輪融資後的訪談中,楊滔就提出:

「大數據的技術很難完全自動化或產品化,但其中有一部分是可以的。所以面向企業的數據科學服的最佳的方式是不斷升級可以用通用的底層演算法產品,再結合行業應用的解決方案去客戶端落地。同時,不斷把行業應用解決方案中可以產品化的部分再產品化,進一步結合工程師面向客戶的行業經驗,做出更好的解決方案。然後積累到足夠經驗,再不斷把解決方案中可以產品化的部分產品化——如此循環遞進,不斷升級。

簡而言之,數據智能化就是將業務經驗數據化,並將解決方案中重複的及有規律的部分不斷產品化,交給機器去做,使數據工程師與行業專家有更多的精力去解決業務中最核心的問題。」

短短數月,當初只在理想中的構思和方向,桃樹都已逐漸一一實現。

就在兩天前,桃樹DataBrain的Atom 6.0版已正式發布,一個更強大的人機協作引擎已經準備好了迎接人工智慧時代新的挑戰。

「每當我研發Atom,我就感覺自己在塑造一個會學習的機器生命。當初之所以把公司叫做桃樹,是因為希望『桃李滿天下』。人工智慧時代,真正的強者絕不是取代別人,而是賦能於別人,讓人人都成為武藝高超的數據科學家。」楊滔如是說。


推薦閱讀:

不懂編程照樣用機器學習
AI再亂圍棋圈:「食言之戰」柯潔落敗;首例素人作弊引風波
機器學習的數學原理
人工智慧的過去、現在、未來和幻想
書評 | 《未來簡史》:失望之作,一次堆砌科技新聞囈語的自嗨

TAG:科技 | 機器人 | 人工智慧 |