人工智慧興起,中國在半導體晶元領域能否彎道超車?

撰稿:賈寧

更多內容請關注微信公號:新經濟100人

英偉達的股價從20美元漲到200美元,只用了兩年。

這多半歸功於自2015年以來人工智慧的興起。機器學習消耗大量數字運算能力,CPU雖然能夠處理複雜問題,但並不適合AI應用程序。英偉達的GPU有數百甚至更多專用核心並行工作,天然適合AI。

2017年年底,英偉達推出了一款Titan V顯卡,號稱最強顯卡,超越其前代性能9倍,售價3000美元。一家獨大,定價就這麼任性。

這個曾瀕臨破產的公司,現在成為耀眼的千億美元明星企業。

技術變革帶來市場格局的巨變,也引來一群垂涎的新選手:寒武紀、地平線、深鑒科技……在這個千億美元競技場上,90後、深鑒科技創始人兼CEO姚頌是最年輕的競爭者。

01 人工智慧中的「清華幫」

2015年,23歲的姚頌從清華大學本科畢業,拒了卡耐基梅隆大學給的offer。

本科導師汪玉勸他,既然不想去,那不如留下來做一年研究。姚頌覺得既然都是做事情,不如創業。

就這樣,姚頌拉著老師汪玉,以及遠在美國斯坦福大學(當時PHD在讀,後任教MIT)的韓松,創立了深鑒科技。作為創始團隊中唯一一個全職人員,姚頌成為了CEO,開始了從學生到公司創始人的角色轉變。

時間來不及讓他慢慢適應。

2015年11月28日做出決定,第二天姚頌就開始寫BP、見投資人。一天見一位,白天談融資,晚上修改BP。一連十幾個投資人,都對他們表示疑慮:純學術的團隊,一位太過年輕的CEO、一位大學老師、一位美國PHD,到底能不能幹成這件事?

深鑒科技聯合創始人汪玉告訴新經濟100人:「講了無數遍BP,被人拍得死去活來的。我們回來接著改、接著講、再接著改、再接著講。」

他認為姚頌抗壓能力很強,這也是為什麼年輕的姚頌能做CEO的緣故之一。

「抗壓是第一位的,因為時時刻刻都在擔心,融不到錢怎麼辦,找不到人怎麼辦,東西做不出來怎麼辦。外面也有不好的評論,覺得這一撥小毛孩出來做晶元不靠譜。但是,我們都頂過來了。」

姚頌是長沙人,霸蠻,「學生時代的我其實屬於支配慾望比較強的人,就是我認定了,就這麼干,哪怕外面都在質疑。」

直到2016年2月份,姚頌到矽谷參加學術會議,遇到了金沙江創投在美國的合伙人林仁俊。兩人聊了一下午,從人工智慧和半導體行業幾十年的發展,聊到後摩爾定律時代的晶元延續,最後得到一個結論,交叉點一定會出現人工智慧晶元,當場談定意向,第二周就簽了合同。

▲深鑒科技創始人兼CEO姚頌

從創始人到員工,早期的深鑒充滿了學院氣息,有很多兼職學生和實習生。雖然汪玉從2007年開始做硬體加速研究,積累了一定的技術,深鑒團隊已經有組織架構、產品形態,但技術部門之間沒有形成很好的合力,產品進度比較慢,滿足不了產品級要求。

2016年年底,單羿加入深鑒科技,擔任CTO,調整了團隊成員結構,將學生替換成社招人員,提高研發標準,加速產品落地。

優化後的團隊,分為演算法、軟體、硬體和晶元四個方向。核心是做晶元系統,由晶元提供算力,硬體為晶元打磨硬體系統,同時用FPGA這種平台做先期客戶的接觸和反饋。軟體把壓縮工具、量化工具、編譯器工具、部署工具穿到一起,形成一個產品系統。同時關注最新演算法的演進趨勢,為晶元架構設計提供指導。

單羿是汪玉帶的第一位博士生,後加入深鑒。隨著人工智慧熱潮漸起,人才的爭奪戰日趨白熱化。

工業界有兩個「黃埔軍校」,一個是百度,一個是微軟亞洲研究院。曠視科技引入微軟亞洲研究院的首席研究員孫劍,擔任首席科學家,增強演算法上的競爭力。商湯科技創始人湯曉鷗出身香港中文大學,其實驗室有關計算機視覺演算法亞洲排行第一,與曠視創始人印奇是老師學生關係。二者分庭抗禮,一直競爭到今天。

深鑒科技有著清華和斯坦福的雙重學術背景,吸引到的多是此類學術背景的人才,以電子系和微電子專業居多,更偏向工程類人才。目前公司100人有一半以上來自清華。

清華幫在國內人工智慧領域「呼風喚雨」,曠視科技團隊多來自清華計算機系。地平線軟體副總裁楊銘、演算法副總裁黃暢也是來自清華電子系和計算機系。商湯科技副總裁楊帆亦是清華電子系出身。

「全國清華相關專業畢業的碩博一年加起來也就百餘人,有BAT、華為、商湯、曠視,以及我們在搶。所以每一家公司能夠分到幾個就已經很不容易。」姚頌說。

引進人才的好處也是明顯的:2017年10月,深鑒一口氣推出6款深度學習產品,產品落地、商業化速度明顯加快。

02 主打低功耗

一塊綠色的PCB板子上,數億晶體管集成到一張小小的黑色晶元里,約礦泉水瓶蓋大小。

板子前面連接著攝像頭,採集到的數據在前端實時處理。顯示屏上,可以看到來往人群中被框起來的每個人。

它的模組規格50mm*60mm,每秒可處理18fps@1080p視頻,單幀可30張以上人臉檢測、建模及識別,支持GoogleNet、VGG、SSD、ResNet、YOLO等深度學習網路部署,功耗5W。

這是2017年深鑒重點推出的安防產品晶元,一個方案大約400元,推出兩個月,接到幾萬個的訂單。

「我們對標英偉達,但是效率更高。我們跟英偉達的晶元區別在於,他們在市面上賣幾千美元的板卡,對於我們來講,提供類似的算力,我們的晶元成本可能只有10美元。」單羿說。

英偉達現在沒有旗鼓相當的競爭對手,在某些場景里隨意定價。這也給後來的創業公司提供了機會,做到成本可控,為客戶提供更低的價格。

▲深度學習加速模塊——智能IPC

神經網路既是計算密集的任務,又是存儲密集的任務。早年經歷了從優化計算引擎到優化存儲系統,如今演算法和硬體分開的情況下已經達到了優化的極限,所以深鑒選擇軟硬體協同設計,利用壓縮和稀疏化達到整體最高效的方案。這套解決方案中的主要技術,獲得ICLR 2016、FPGA 2017最佳論文獎。

簡單來說,神經網路訓練模型時更在意精度的提升,有很多運算是冗餘的。在獲得精度之後,找出其中的冗餘部分,將其去掉,以實現獲取收益減去負擔。

壓縮之後可以把模型變小,比如變小50倍。晶元是一個運算單元、一個處理器,外面掛著內存以及硬碟等存儲設備。如果模型變小,內存縮小到一定程度時,可以把它放在晶元里,不再需要外接內存,幫助客戶省掉內存的成本。

此外,當模型變小以後,運算的次數也變少了,計算的時間會縮短,功耗也會進一步降低。

深鑒科技宣稱,在算力同等的條件下,GPU的功耗在十幾瓦左右,深鑒晶元的功耗只有3瓦。

深鑒科技商務副總裁劉競秀說:「演算法本身不是我們最強的地方,我們強在可以利用我們獨門的壓縮技術,結合我們的DPU把演算法發揮更好的端到端效果。」

但是硬體公司的普遍難處在於產品的穩定性和良率。

硬體的打磨周期很長,相對投入很大。第一代晶元流片(像流水線一樣通過一系列工藝步驟製造晶元)出來,很難與有多年晶元設計製造經驗的英偉達相抗衡。英偉達與產業鏈的結合次數更多,配合關係更好,能夠每個環節發揮出最優的效果,在這方面創業公司是有劣勢的。

並且,晶元設計中可能存在著一些風險和要迭代的地方。比如,公司在設計時期待晶元能發揮出90%以上的利用率,但實際生產出來後可能只有80%或70%。這在沒做出晶元之前,很難預計會有怎樣的問題。但是改進的成本很高,不能隨意投片,做不到像英偉達那樣快速迭代。

深鑒通過與A輪、A+輪的投資方合作晶元,來解決一些財力、人力、經驗等方面不足的問題,這其中包括三星、聯發科和賽靈思。同時,與這些廠商合作,也是滲入到其他行業的一塊敲門磚。

▲深鑒科技創始團隊(從左到右:單羿、汪玉、姚頌、韓松)

「我們現在整體來看已經比英偉達做得要好一些,但是不確定是不是真的有優勢。因為對英偉達來說,他不著急把最好的東西放出來,只要市場上沒有競爭對手,他可以把先研發的東西緩一緩再拿出來。」單羿說。

03 從安防撕開商業化口子

剛走出院校的深鑒科技在晶元落地上,也曾經走過一段「彎路」。

2016年,他們與一家無人機公司合作,推出了一款只有巴掌大小的智能無人機,在滿足尺寸、功耗、價格的條件下,通過Zynq FPGA平台實現實時的多人檢測、姿態識別、追蹤。

對姚頌來說,這是他第一次用具體的產品將零散的技術串起來,無人機對晶元的要求並不高,是理想的試水產品,但不是一個可以全身投入的行業。

因為市場太小了,養不活AI公司。大疆無人機占著市場70%以上,一年出貨百萬台,剩下30%被幾百家公司瓜分。

晶元本身是一個高投入、邊際成本很低的產品,它前期研發成本很高,後期批量生產成本非常低。矽片的硬體成本和原料成本,姚頌把它戲稱為「沙子錢」。晶元靠量產把研發成本攤薄,無人機市場顯然滿足不了「量」的要求。

那自動駕駛呢?三五年不會有量產車上路,創業公司拖不起。新經濟100人最近採訪一家國內無人駕駛公司,其提到研發早期調研了一圈國內外晶元公司,發現國內晶元普遍主打低功耗、高性價比,但在運算能力和穩定性上與國際一線仍有較大差距,所以最終仍然選擇與英偉達合作。

智能家居呢?風聲大雨點小,沒有幾個家庭真正用上。數據中心呢?英偉達打算接手英特爾的攤子,正在全面布局,直接交鋒不理智。

人工智慧的概念太熱,卻一直在為商業化苦苦掙扎。作為人工智慧的技術底層晶元供應商,深鑒也在摸索類似的路徑。

2016年末,姚頌做了好幾個月的調研,他認為公司應該嘗試轉型安防領域,並且在春節前後召開核心成員的閉門會議討論最終決策。

安防的水很深,整個系統格局非常複雜,是一個相對封閉的環境。海康威視、大華這種安防產品的行業巨頭,掌握了大部分的資源,而一些小的安防設備公司,也在各自的地盤有著不錯的營生。

「我們不想做海康、大華的競爭對手,也不想做本地經銷商的競爭對手,我們是想做海康、大華背後AI方案的提供商。我們最擅長的就是做跟AI相關的一整套方案。這些做安防設備的公司他們最缺的也是這個能力,因為他們都是傳統公司,都是靠做硬體、軟體起家的,沒有做AI的經驗。」劉競秀說。

深鑒與安防廠商合作,可以一到兩個月幫他們出一款有AI能力的新產品。硬體的模組、演算法、軟體都是現成的,客戶只要做硬體的對接,把硬體插到機器里就可以工作。如果他們自己研發的話至少要半年、一年甚至更長的時間。

在新經濟100人訪談中,姚頌和其他高管們多次提到英偉達。英偉達依靠GPU在數據中心、自動駕駛(英偉達拿到了特斯拉訂單)等領域橫衝直撞。在安防領域,基於GPU的智能安防成本比較高。GPU高性能、高功耗、高成本,最低功耗在15瓦以上,這要求GPU布局在伺服器端,一般能夠承擔起這個成本的是公安。

像小區安防布置視頻監控,有4到8個攝像頭,不可能布置伺服器在小區,也不會直接連到公安,只會連到保安室讓人在電腦上盯著。

將英偉達視作對標的深鑒,主打的是低功耗,範圍在1-20瓦。這可以滿足小區視頻監控的需求,做成一個功耗十幾瓦到二十瓦的小盒子,能做八路視頻識別,攝像頭直接連接小盒子,數據再傳到電腦上看。

金溢科技,全國最大的ETC公司,主營公路收費、停車收費。傳統ETC在地底下埋一個線圈,車通過的時候,上面的雷達探測到車輛,線圈會感應上面ETC的晶元卡,進行收費。

它的痛點在於線圈昂貴、易損耗,只能進口,廣泛應用在停車場,成本會非常高。此外,如果不是ETC的車,開到ETC通道,還要倒車出去換一個通道。他們希望在傳統的線圈電磁感應之外,加一塊視頻作為輔助,在路邊吊個桿掛一個小攝像頭,識別車型和車牌號。在高速公路通行雷達上面加一個攝像頭,遠遠就看到車輛牌照,如果不是ETC的車輛,就請車輛走另外的車道。

金溢科技也是深鑒第一批軟體客戶。軟體對於AI的晶元來說非常關鍵,英特爾之所以成功與和微軟深度綁定有關,AMD之所以市值才百億美元,也與軟體做得很差脫不開干係。

「我們做了國內第一個,現在唯一敢拿出來給用戶使用的神經網路開發軟體DNNDK。開發軟體有很多預設,但是用戶的使用情況是千般萬種,不會按照規定去做,所以也給了我們很多的反饋。」姚頌說。

目前,深鑒與大華等大型廠商的接觸還在測試階段,第二梯隊的安防公司許多已經進入了聯合研發階段。

04 AI晶元:中國彎道超車機會

國內研發AI晶元的公司,除了深鑒以外,還有寒武紀、地平線等。寒武紀側重於通用晶元,既做訓練又做應用,首先布局在智能終端。

「我們的晶元叫做DPU,這是深度學習處理器。AI分訓練和應用兩層,我們只做深度學習應用端,不做訓練端。」姚頌告訴新經濟100人。

地平線則是提供一個閉環的封閉系統,客戶購買演算法加上硬體的全套解決方案,演算法加硬體都固定在一個「黑盒子」里。

深鑒的用戶則可以選擇用不用他們的演算法。這導致整個產品設計思路完全不同。

「比如我就想用這一袋麵粉做饅頭,那我可能做幾種樣子的饅頭,但是如果我想用這個麵粉做面點,那你在後廚需要準備的東西肯定要比只做饅頭複雜很多。」劉競秀說。

▲製圖:彭瑞

這是為了迎合客戶的需求,打造一整套生態環境。在「數據為王」的時代,客戶都希望把數據掌握在自己手中,利用手裡的數據形成對行業的理解,做定製的演算法,從而增加公司的附加價值。

就像英特爾最開始做了CPU之後,定下標準的介面,交由主板公司解決硬體層問題。之後在上層跑一個Windows操作系統,通過中間的程序支持滑鼠、鍵盤、攝像頭等外接設備,最終才能在系統上運行諸如Office這樣的應用。所以英特爾做了大量工作,讓微軟把操作系統部署在上面,才有了今天英特爾CPU在PC的廣泛應用。

到了AI時代,打造生態又變成所有晶元行業巨頭和創業公司最大的挑戰。英偉達發布了工具TensorRT,深鑒也公開發布了類似編譯器和工具。

在半導體晶元領域,中國在全球一直處於追趕者的角色。CPU晶元一直被英特爾等國外巨頭壟斷,2016年中國在半導體晶元進口上的花費已經接近原油的兩倍。

人工智慧的興起,正在引發各行各業的變革。舊型晶元不能完全滿足機器學習的需求,英特爾與英偉達多年的技術積累不再作為壁壘(GPU非專門的AI晶元),而是與國內創業公司站在同一個起跑線上,為機器學習研發專門的新型晶元。

「我們是一個人工智慧平台的公司,在技術角度,我希望所有行業都可以用我的產品。從商業角度,我們希望在這兩年把一個大的市場吃下來,站住腳,再五年的階段能夠吃下來三個不同的市場。」姚頌接著靦腆一笑,「我現在要多聽取批評,少年得志容易驕傲,還是要多打壓一下。」

他帶著半框眼鏡,穿著深灰色連帽衫,看起來像剛從實驗室走出來,接著又要去圖書館的學生。

正如現在的AI行業一樣,一切才剛剛開始。

推薦閱讀:

BAT齊發力人工智慧,只有馬化騰說出了痛點
如何評價地平線機器人在2017年12月20日 發布的人工智慧晶元?

TAG:人工智能 | AI芯片 |