商湯科技聯合創始人徐冰:人工智慧的特殊商業模式探索

來源:數據猿 作者:徐冰

2017年2月16日,由數據猿、中歐商學院、騰訊直播共同舉辦的《中歐微論壇|數據猿·超聲波》活動在中歐商學院北京校區圓滿落幕。此次活動大咖雲集,共吸引了600+人報名,並最終篩選出300+觀眾蒞臨現場,更有超過20000名觀眾收看了在線直播,開啟了一場大數據、人工智慧領域的頭腦風暴,台上台下、線上線下共同暢想科技引領下的商業未來!

作為數據猿推出的主題為《大數據的2016,我的2016》2016—2017年度大型策劃活動的一部分,在2016年底徵稿期,活動就受到了100+大數據領域內知名企業的高度關注,收到了36位業內領袖的投稿,併入駐成為數據猿專欄專家。


以下是「商湯科技聯合創始人徐冰」的精彩文字版演講內容:

大家下午好,剛剛聽前面幾位嘉賓的演講,尤其是聽到TalkingData鮑總的演講時,讓我有點「心虛」,因為我們就是一家專門做人工智慧演算法的企業。鮑總剛才講到,人工智慧會導致一些人失業。商湯在2016年服務了很多客戶,給他們提供了各種AI演算法。確實,有些客戶在購買演算法後,對內部勞動力結構做了調整,把一些人員裁掉了。這件事情如果一旦放到倫理的角度去講,我們可能永遠都講不完了。

我發現每位嘉賓都用非常通俗易懂的語言把深度學習這項技術講得很清楚了,我作為一家做深度學習技術的企業嘉賓,也沒什麼好講的了。今天就先跟大家分享兩點:

第一,商湯在深度學習上是具體怎麼投入的?比如如何建超算、整合數據資源、研究演算法等,怎麼做到技術超出人類水平。

第二,在演算法做到超過人類之後,現在到底在哪些行業進行應用了?比如安防監控、互聯網金融、機器人等,它們怎麼在用,哪些地方用了之後帶來效益上的增長。

人工智慧是下一波技術浪潮

人工智慧概念在1956年被提出來,這項技術目標是為了提高效率、降低成本,提高生產力,解放勞動力。如果可以實現,肯定會有非常大的商業價值,就像當時蒸汽機被發明一樣,交通、紡織等許多行業都被顛覆了。人工智慧發展到現在,經歷了三起兩落,歷史上其實也有兩撥熱潮,有很多科學家研究人員說人工智慧時代到來了,但是後來很快冷下去了,根本原因是人工智慧技術的精度和技術指標還未達標,跟人還相差很遠。所以,真正去買人工智慧技術的商家買了之後發現沒什麼用,他就不會再繼續買了,也不向周圍人推薦,人工智慧就冷了下來。

為什麼從2014年開始又火起來了呢?主要深度學習的帶動之下,人工智慧技術精度大幅提升了,而客戶端的反饋也發生了根本的變化,客戶買了人工智慧類別的產品之後,發現原來1000個人能完成的事情,現在只需要100人就可以了。大量簡單的、重複性工作用演算法就可以完成,只需要少量的人力篩查一下,或者處理比較難的案例。從去年來看,人工智慧落地的速度已經遠遠超過我們的想像,到2017年之後,我們看到越來越多的大企業有更多的預算採購AI演算法,或組建自己的人工智慧團隊,讓自己的產品和業務得到持續的升級。

深度學習——帶來各項人工智慧技術的突破

深度學習是在大量的數據之上去挖掘、總結數據里的一些規律,最終讓機器學習到某一項技能,比如下圍棋。其實,人工智慧不僅在圍棋上可以超過人類水平,在2014年,人臉識別技術已經超過了人類水平;2015年,圖像分類,人的誤差是5%,技術現在最低的誤差已經到2%-3%;自動駕駛方面,去年所有的車廠,大量的互聯網公司,包括像滴滴、優步全部都投入到自動駕駛上,收購一些自動駕駛演算法公司,大家開始在車上安裝各種採集行車數據的設備,去教機器怎麼開車;語言的理解、翻譯,去年穀歌也得到了演算法的重大突破;深度學習也開始被應用到生命科學上做DNA的一些分析。

可以看到深度學習的通用性非常強,它用在各個領域裡面,在看似不相關的各種應用技術上,都產生了效益。這些具體技能性的應用,當它做到接近人或者超過人類水平的時候,就可以用到行業裡面,幫助規模化地提高行業的生產效率。

深度學習的三大核心要素

這一頁講到的技術,剛剛大家也分享到了, 大數據、計算性能、演算法,三個維度上同時取得突破,帶來了這一波新的商機。下面我簡單分享一下,商湯在這些上都做了什麼。

首先一句話介紹一下商湯,我們是一家深度學習演算法公司,目前是國內該領域,技術團隊規模最大、商業化訂單、收入及融資額最多的公司。

在演算法上,我們壟斷性聚攏了超過100多名博士、教授進行演算法研究,每個月投入千萬量級的研發經費,搭建底層的深度學習框架和演算法平台;在應用層,我們做各種視覺識別演算法,如人臉識別、視頻分析、無人駕駛視覺、醫療影像識別等。

演算法其實目前依然處在高速發展期,舉一個非常典型的案例:在200類物體的檢測、識別這項任務,隨便給一張照片進行內容辨識,識別什麼樣的物體在什麼樣的位置。這是一個完全不受控的演算法問題,物體之間有相互遮擋,有形變,非常難。2013年,這項任務的平均精度只有22%。但是深度學習出現後,2014年Google就到了43%的精度,提升一倍。2015年,我們的演算法又高出了Google 7個點,半年後,微軟的演算法又提高了十幾個點,而現在,我們最新的結果又比微軟高了4個點。

這樣快速的演算法提升,以前在學術界以前是不可能發生的,在2011年往前,各種AI演算法精度,一年提升一到兩個點已經很了不起了,那時候大家都看不到人工智慧會在什麼時候成熟。但像現在的一些演算法,一年之內可以提升5到10個點這樣的速度,相當於之前10年的積累。對於現在做深度學習的企業來講,一個核心的競爭力並不是說在當前的時間點上演算法領先,而是如何保持持續的演算法領先。因為今天領先,可能明天就會被別人超過,需要有超強的創新能力,持續改進演算法,跟頂尖的演算法團隊賽跑,持續地去超過別人。

在超算能力上,也是要有實實在在的投入,現在做大規模深度學習演算法研究,必須有GPU超算,如果你的數據量特別大,用一台伺服器,或者普通的CPU為主的集群,根本沒有辦法適配大規模的訓練。神經網路訓練對並行計算能力的需求,使得大部分做深度學習的企業,包括谷歌、微軟等等的,全部都要向NVIDIA這家公司購買大量的GPU計算卡,NVIDIA的股價去年漲了四五倍。用NVIDIA GPU建設集群已經變成一項AI領域的基礎設施,有強大的並行計算能力,才能保證演算法有比較高的迭代效率。

我們最早在2011年做深度學習,那時候沒有這樣的集群。2014年,我們用20萬張的圖片量做人臉識別,全球首次做到了超過人眼精度的突破,當時使用1000個核的CPU集群,訓練一個月只出一次結果,意味著一年只能迭代12次,所以那時候做演算法創新是非常痛苦的。而現在有GPU集群,200塊GPU卡,六千萬的人臉照片用作訓練,基本可以在兩個小時之內完成一次迭代,還可以同時開啟10-20個不同的任務,用不同的網路結構,不同的參數去嘗試,看最後的結果好不好。集群帶來計算性能上的提升是上百倍,上千倍的效益。所以這件事情本身就保證了演算法能夠高速的迭代和提升。

規模化數據標註處理

第三塊是數據,中國在數據上有比較大的優勢,14億人口每個人都是數據的生產源。我們在獲取數據時,是用演算法升級去做交換的。我們大量的客戶,持續給我提供演算法訓練所需的數據,用於演算法的研究和性能上的提升,讓我們可以給客戶供應更好的演算法,相互支持。而標註數據——向機器描述什麼是一盆花、一個瓶子,讓他去學——這需要非常多人力,所需成本遠遠高於採集數據。而這些又是必須的,因為不做這些機器就沒法學習。因此這裡也是一部分底層能力的建設,如何更高效、半自動、成規模地標註數據。

其實在人工智慧行業整個的業務流程中,以上三方面的投入、成本都是共用的,這些叫基礎設施層的投入,這一層的投入完成後就到應用層,我們把基礎設施層的能力建設紮實,去研發這些應用,比如人臉識別演算法、成像感知演算法、圖像理解和搜索演算法等等一些跟客戶需求有直接相關性的演算法。這些應用演算法其實就幫助解決各個行業裡面,某些勞動力密集可以提高效率的環節。像安防行業,我把現有的通過我統一的深度學習平台,一套共用的成本所研發出來的演算法組合在一起,就推出一套解決方案。針對金融行業我可能就是另外一個組合再推出一套解決方案,你會發現這裡面大量的技術模塊都是共用的。進入每個行業的邊際成本很低,這裡就反映出深度學習的平台效應。

顛覆——安防/智慧城市

我們來看看在安防行業裡面成規模用起來的一些技術,比如下面這個項目:視頻結構化平台。當時這款產品被一些到我們公司參觀的人拍下來之後傳到網上,引起了很大的轟動。「現在我走在路上,攝像頭拍到我,都是頭上頂著各種標籤的!」

但這項技術在去年之前,技術精度低到沒有人去用,去年年中才成熟。這是一個非常複雜的場景:一個十字路口,所有的機動車、非機動車、人都要檢測和追蹤,以及識別屬性標籤,比如這輛車是什麼顏色,什麼型號,車牌是什麼;這個人是男是女,成年還是小孩,衣服顏色,有沒有背包…這樣的一些屬性給記錄下來,首先是方便檢索,公安破案的時候直接輸入關鍵詞搜索就可以找到相關監控錄像了,不需要像過去一樣幾千名民警把所有區域的監控拷空,回家一人分一百個小時自己看,對警力造成了極大程度上的佔用;同時中國一半以上的硬碟全都是來存儲監控視頻,而現在可以存下屬性標籤和截圖,所以這也是一個存儲效率的提升。另外還幫助你去判斷有沒有異常的事件,事中的預警。

另外這是人群分析系統。這是在上海外灘的一個場景。當年發生踩踏事件之後,大家都在想有沒有一種演算法可以每時每刻監控這個場景的人數,當這個人數一旦有超標的趨勢,就派人去線下疏導人流,這個就是基於深度學習,去理解這個場景裡面有多少人,每時每刻做一個實時的計數,現在這樣一套產品部署到上海外灘,可以進一步預防由於人數太多而出現的踩踏事件。

這一項也是非常典型的應用,在一些關鍵位置,比如電梯口、通道等位置部署一個攝像頭,它把拍到所有人的人臉抓下來之後,跟黑名單做一個比對,如果有罪犯在裡面就會自動報警。再換一個場景,比如放在酒店、放在機場等,實際上意味著我有一個白名單,全部都是VIP、高級客戶、高凈值客戶,我識別出現他之後,我就要針對這些高端客戶服務,那就變成一套VIP識別系統。

再比如說,現在的攝像頭在100米開外這麼遠的距離之內,有沒有可能也能夠識別出你是誰來?對應一些產品,比如說100米之外對人的識別,對車的識別,以及對整個廣場的識別,對這樣一個廣泛區域進行高效監控,對廣場里所發生的事情進行識別,這樣當出現特殊情況時,比如有一波人在聚集,監控會把每一個人抓下來之後跟黑名單做一個比對,並且全部是自動化完成。


顛覆——互聯網身份認證

剛剛那些例子講了一些跟大家日常的人身安全,包括跟公安刑偵、安保相關的效率上產生的一些具體的價值和提升的點。而在金融領域也有一個非常價值的提升效率的點,就是身份認證環節。傳統來講,銀行、金融公司在服務客戶的時候,首先要認證你的身份,完了才能開戶,借給你錢。在過去,這個環節是靠肉眼去看的,拿著身份證看你是否是本人,這個事情本身第一會產生誤差,第二消耗人力。

為什麼我們開一個銀行賬戶不能像開一個QQ號一樣簡單,現在移動互聯網這麼發達,我們手機就可以開戶,為什麼不能實現?其實就卡在身份認證這個環節,但現在這件事也因為演算法上的突破技術更成熟了。

在去年一共有接近4億人使用我們的人臉識別、文字識別技術進行了實名認證,互聯網金融公司以借貸寶為代表,用戶量一年實現了一億的增長,我們的技術保證這一億全部都是實名制的客戶,這一類金融類機構大概認證了1.6億到兩億人。

另外一類通信,移動運營商去年有一個國家要求的指標,必須要完成未實名制的手機卡。去年中國移動用我們的演算法做了3億人卡的認證。這項技術已經被規模的用起來了。

包括樂視,在系統上加入一個刷臉就可登陸的技術,對提高用戶體驗很有幫助。

顛覆——智慧商業

現在講消費升級,如何獲取線下的消費信息?比如什麼樣的人對什麼產品感興趣?這個我很難知道。現在基於視覺職別,我可以知道什麼類別的人,分別在什麼區域停留多長時間?什麼店鋪去了多少次?這些數據可以收集上來在線上做一些分析。

顛覆——移動智能、增強現實

一些AI演算法也帶來了用戶體驗上的改善和交互模式上的提升,比如在拍照的時候,把模糊的照片進行一個處理,暗色的照片進行提亮,這些實際上都是背後基於深度學習技術,去學習如何把這些有問題的照片恢復回來。比如說現在還有一項很火的應用,如何用手機,比如類似蘋果7PLUS,雙攝像頭能夠拍出來3D的照片,能夠模擬出來單反的拍照演算法。一個簡單手機就可以拍出大光圈的單反效果,這其實背後全都是我們提供的深度學習演算法。

還有比如拍到的這個照片內容,進行識別然後做智能相冊,個人照片分一類,你太太的照片分一類,小孩的照片分一類,現在小米和華為已經全部上線這項技術,包括微博。去年也有一些年輕人喜歡用的產品,增強現實的貼紙特效,一年內有50多家直播公司和APP公司找我們採購這項技術,基於人臉關鍵點追蹤。

當然我們看到有一些更加前瞻性的、顛覆性的技術也在研發過程之中,像無人駕駛。無人駕駛是一個非常複雜的場景,在劇烈的光線變化下,在沒有路燈的環境下,還有下雨下雪的情況下等,你要保證你的演算法具有一個比較強的穩定性,所以這個場景是一個對演算法本身的精度要求很高的,同時也是非常難做的一個場景。另外還有人機交互,機器人也很火,但是機器人怎麼跟你交互,你擺出來一些姿態之後,它要理解你,這裡面也需要非常精準的演算法。

接下來是遙感,所有的遙感照片,衛星拍到的照片,都是人工標註解析的,但是現在這些標註任務已經完全可以被機器替代了,演算法的標註精度不低於標註員,效率也很高,一個標記員標記北京市高清地圖需要30天時間,但是一台普通電腦搭載演算法9個小時就可以完成。這裡帶來的是全行業50%以上的生產效率的提升。

人工智慧的特殊商業模式探索

這麼多AI技術可以提高應用上的效率,而且商業模式上,現在多數是通過SaaS服務按API調用量收費,SDK按license數量收費,把這個演算法做到晶元化,以晶元出貨量計費,或放到伺服器上按照軟硬體一體的方式收費等等,這些是比較傳統的2B的技術提供、技術輸出的收費模式。但是我們看到AI帶來的經濟效益遠遠不止於此,客戶通過使用AI演算法,進行成本結構上的改善可以帶來利潤上的顯著提升。提供這個層次的技術,如果只是付給我100萬的年費的話,明顯不划算。

所以像這類的場景下,我們看到投資是非常好的結合方式,如果我已經用技術驗證了,可以幫助把客戶的利潤、收入提升30%到50%,那麼我應該提前投資這家企業,獲得股票價值增長的收益,甚至可以控股這家企業,它提升了一個億兩個億的利潤,都可以直接併入我的報表。這可能是在未來,比較適配人工智慧這項產生巨大價值的技術的商業模式。這也是我們在著重探索的商業模式。

如上就是我的分享,謝謝大家!


本次活動其他演講嘉賓:

中歐國際工商學院經濟學與決策科學教授 方躍

京東萬象總經理杜宇甫

360大數據中心副總經理 傅志華

TalkingData首席佈道師 鮑忠鐵

天雲大數據CEO 雷濤

註:以上所有內容由數據猿編輯整理並發布,更多內容請關注數據猿獲取實時動態。

獲取演講嘉賓乾貨PPT請關注數據猿微信公眾號【datayuancn】並回復關鍵詞「徐冰」即可


推薦閱讀:

【視頻&PPT】京東萬象總經理杜宇甫:用科技助力數據流通,社會將更加智慧!

【視頻&PPT】360大數據中心副總經理傅志華:企業如何有效的實施大數據戰略

【視頻&PPT】天雲大數據CEO雷濤:人類如何與機器共生?


推薦閱讀:

再見2017,腦洞2038
《深度卷積網路:從AlphaGo到GAN》連載:2.2.8 ~ 2.3.3
報名開啟 | 有可能是這個夏天最酷的技術峰會!
想入門設計卷積神經網路?這是一份綜合設計指南
《智能時代》

TAG:科技 | 人工智慧 | 商業 | 商業模式 | 智慧 | 創始人 | 探索 | 徐冰 | 聯合創始人 | 模式 | 人工 |