獨家 | 自動駕駛熱潮引燃AI晶元大戰,爆點不止特斯拉一家

之前被炒的沸沸揚揚、多次被媒體尋找蛛絲馬跡來證明真實性的「特斯拉自研AI晶元」傳聞,這個月初被馬斯克親自敲了實錘。在今年12月初的神經信息處理系統大會NIPS上,馬斯克承認,特斯拉自動駕駛硬體工程副總裁JimKeller正在領導AI晶元的開發工作。同時他表示,堅信Keller可以打造出「世界上最好的AI定製硬體」。

Keller如此被馬斯克信任也不是沒有原因。他可以稱得上是天才架構師,最早時在DEC工作時,參與設計了Alpha 21164和21264處理器,被應用在許多大型主機中,包括中國超級計算濟南中芯的神威藍光超級計算器;在AMD期間,設計出了K7和K8等知名架構,業界首款突破GHz的CPU架構便是出自其手;後來又在蘋果設計出了A4、A5處理器,這是當年iPhone最核心的部件;在回到AMD之後,Keller奉獻了Zen架構,基於此架構的Ryzen讓AMD在2017年鹹魚翻身。

在2016年跳槽到特斯拉之後,Jim Keller從AMD帶走了一批架構師和高管,根據CNBC在9月份的一則報道,特斯拉已經有超過50人在從事AI晶元的開發了,從中也可以看出特斯拉早已置下的自研AI晶元的野心。

AI晶元事關特斯拉自動駕駛的未來

在自動輔助駕駛系統Autopilot直至8.0版本之前,特斯拉一直採用的是Mobileye的Eye Q3晶元。Mobileye是一家創立於以色列的公司,專註於ADAS(高級輔助駕駛系統)的軟硬體開發,其特有的EyeQ視覺識別晶元以及ADAS軟體被應用於多家汽車廠商,如沃爾沃、寶馬、奧迪等。Mobileye的優勢很明顯:自由空間標記、啟發式路徑尋找、道路避障和路牌識別。

不過,特斯拉並沒有完全採用Mobileye的軟體,而是通過自己的軟體結合Mobileye以及英偉達硬體來實現自己的自動輔助駕駛。Mobileye的Amnon博士曾親口證實過,特斯拉的自動輔助駕駛使用了一部分EyeQ3的計算能力,而沒有使用其自有的功能,如紅綠燈識別,無中間黃線的雙行道識別等;另外,去年5月發生的第一起自動輔助駕駛中產生的車禍也能證明此事。

當時,一位司機駕駛特斯拉的Model S在佛羅里達一條未封閉的高速上因為與橫穿馬路的大卡車相撞而喪命,Mobileye的發言人澄清說自己的系統主要是應對於追尾導致的碰撞,而不能勝任這樣的碰撞檢測,類似這樣的情況會在2018年左右的新系統中解決,而特斯拉的發言人則回應說,特斯拉雖然使用了Mobileye的晶元,但是技術上已經涵蓋了這種碰撞處理,只是由於當時環境條件導致失誤,沒能阻止慘劇發生。

在發生這起車禍時,攝像頭剛好遇到太陽下山時強烈的背光導致識別能力不足,收集到的數據不完備,而這不完備的2D數據又經過圖像識別加工成錯誤的3D場景,讓車誤判了前方的路況,從而釀成慘禍。

這次車禍是在一個非常極端的情況下,各種負面因素累加而成的結果,屬於系統的一次「漏報」,然而這也暴露了Mobileye技術的不足。此次教訓讓特斯拉延遲了計劃中的8.0系統的發布,且直接加速雷達主導的自動輔助駕駛時代的來臨。

2016年7月,特斯拉與Mobileye分道揚鑣,同年10月,搭載Autopilot 2.0自動駕駛輔助系統的車型開始量產。

Autopilot 1.0是基於Mobileye的圖像識別技術,主要數據來自於車頂的Mobileye攝像頭,車首的雷達和周邊雷達只是提供輔助信息;而Autopilot 2.0則是基於雷達識別環境,主要數據來源於車身上的雷達,而輔助數據則來源於車隊學習的高精度地圖和白名單。

在硬體部分,Autopilot 2.0使用了3個前置攝像頭(不同視角 廣角、長焦、中等)、2個側邊攝像頭(一左一右)、3個後置攝像頭、12個超聲波感測器(感測距離增加一倍)、一個前置雷達(增強版)、一個後置倒車攝像頭,而晶元則使用了英偉達DrivePX 2(40x Autopilot 1.0處理速度)。

英偉達CEO黃仁勛曾表示:「英偉達Drive PX 2是全球首款專為主動駕馭轎車規劃的AI超級計算機,它的運算才能與150台MacBook Pro相當。」

馬斯克接受採訪時表明,在晶元挑選上,AMD和英偉達並沒有太大區別,當然特斯拉終究挑選了英偉達。但這番表述好像表明,特斯拉在晶元挑選上是十分靈敏的。

不過,特斯拉才投向英偉達的方案沒多久,為何又想移情別戀?這要從GPU架構的先天限制說起。

GPU的功耗極為龐大,且推理能力差,基於GPU架構的自動駕駛方案也有同樣的問題。以自動駕駛最常用的CNN卷積神經網路來說,英偉達的Drive PX2推理性能上其實並不算特別出色。為了達到L3、甚至L4以上的自動駕駛功能,Drive PX2最高端的完整自動駕駛版本功耗達250w,性能卻只有20 TFLOPS,因此特斯拉要求英偉達為其定製了一個特殊版本,將最高端版本的規模減半,性能只剩下10 TFLOPS,功耗也大幅降低到100W左右,降低對電池壽命的影響,避免行駛里程過低,但也因此,其自動駕駛能力勉強只能達到L3的程度,而不是其宣稱的L5。

據稱,英偉達推出的下一代Xavier自動駕駛平台在增加性能同時又大幅降低了功耗,理論上特斯拉只要直接升級就好,但根據NVIDIA自己的說法,L5級別的自動駕駛需要兩套Xavier共同合作才能達成。如此一來,成本上的負擔又會增加了。完整版Drive PX2要價1.5萬美元,Xavier只會更貴,若要達成L5自動駕駛則必須搭配兩套Xavier以及周邊感測器,成本恐怕是天價。

另外,曾經的好夥伴Mobileye也即將推出高一級的Eye Q4和Eye Q5。前者可以在3W的功耗下達到2.5 TFLOPS的效率,後者則是在10W的功耗下達到24 TFLOPS。Eye Q系列都是採用CPU混搭向量加速單元來做自動駕駛所需要的卷積神經網路計算,嚴格上來說,就是CPU結合ASIC處理單元的異構產品。

下一代Eye Q4方案要到2018年才會量產。前不久宣布正式上市的蔚來首款量產車ES8就是全球首款安裝Mobileye Eye Q4晶元的車型;而唯一具競爭力的EyeQ5要到2019年甚至更晚才有機會面世,急於推出更高等級自動駕駛功能的特斯拉無法繼續等待,這恐怕是特斯拉打定主意開發自己的AI晶元的原因之一。

自動駕駛的火熱引燃了AI晶元大戰

特斯拉與Mobileye、英偉達的分分合合只是自動駕駛晶元大戰中的冰山一角,其他如英特爾、高通等巨頭也在火力全開加速創新。

2016年,英特爾以167億美元完成了對世界第二大FPGA公司Altera的收購。

目前主流的自動駕駛晶元解決方案主要包括GPU、FPGA、DSP和ASIC四種。相對而言,FPGA高實時,低功耗,可靈活編程,這全都切中了自動駕駛對計算晶元的要求。英特爾在年初推出的自動駕駛計算平台Intel Go中,就使用了FPGA晶元。奧迪新A8自動駕駛所仰賴的核心計算單元zFAS,也使用了Altera的FPGA晶元,內建被英特爾收購的Movidius視覺演算法,負責物體數據和地圖數據的融合,與自動停車功能的實現。

另外,結合FPGA,英特爾可以在雲端處理大量並發的實時計算。這種模式尤其適合人們對智慧城市大腦的設想:每一輛無人車的數據都上傳到一個中樞,由其處理並洞悉每一輛車的狀態,再命令他們如何駕駛。要實現如此,需要5G高寬頻、時延低的數據通道,為此英特爾在今年推出了首款車載5G通信平台。

然而,雖然這一套設想很先進,但是目前短期內實現難度較大,英特爾今年3月以153億美元價格收購了以色列ADAS公司Mobileye,是以先參與進自動輔助駕駛技術的落地。

Mobileye一方面為英特爾提供了切入自動駕駛市場的渠道——前者在全球ADAS市場的份額超過70%;另一方面,Mobileye的核心產品——ADAS專用晶元Eye Q系列,使英特爾形成了針對車輛端的計算晶元解決方案——英特爾的凌動/至強+Mobileye的EyeQ+Altera的FPGA。這153億美元,其實是英特爾為自動駕駛買的門票。

至於高通,由於專註於移動端,其在高性能計算上的積累不如英特爾與英偉達。驍龍SoC雖然在單位能耗上相對英特爾與英偉達的計算平台都佔據優勢,但在峰值性能輸出上則被其功耗限制。加之驍龍SoC又並非為ADAS專門打造的計算平台,因此想要打開自動駕駛汽車的市場,面臨的阻力不小。

去年10月,高通宣布與全球最大的汽車半導體廠商恩智浦達成收購協議。恩智浦在被高通宣布收購之前,就已推出了ADAS專用晶元S32V234,主要用於處理視覺信號,可同時處理兩路視頻。值得一提的是,考慮到ADAS對安全性的要求,S32V234在設計之初就加入了ECC(錯誤檢查與糾正),FCCU(故障收集與控制單元)等安全機制。

隨後在此基礎上,恩智浦發布了BlueBox車載電腦,內部除了搭載S32V234晶元,還加上了應用8核A72的高性能處理器LS2088以及其他感測器晶元,除了支持ADAS,還能夠實現多感測器數據的融合。恩智浦稱,BlueBox能夠為L4級別的自動駕駛提供運算支持,而功耗不超過40W。

不過,高通對恩智浦的收購併非一帆風順,由於雙方未能提供相關文件,歐盟反壟斷機構於今年6月暫停了對這一收購的反壟斷調查,交易遲遲未能完成,高通便無法同恩智浦作為一個整體施行其戰略。此外,持有恩智浦半導體股份的埃利奧特管理公司認為高通低估了恩智浦半導體股票的價格,要求將每股的收購價格有110美元提高到135美元,不過高通拒絕提高收購報價,表示每股110美元公平合理,此事也為這一收購案再添風波。

好在,高通還可以專註於V2X車聯網。今年9月,高通推出新一代V2X通信晶元組9150C-V2X,符合3GPP標準,同時支持4G與5G網路,無需SIM卡,就能夠實現車對車(V2V),車對基礎設施(V2I),車對行人(V2P)三種場景的通信。如果能夠利用5G的高速傳輸,將數據送至雲端再快速處理下發,高通或許可以通過車聯網來實現自動駕駛功能,也算是在這場激烈的晶元競爭中另闢蹊徑。

在自動駕駛方面,我們還不得不提到谷歌。谷歌的自動駕駛方案使用了英特爾提供的至強處理器、Altera提供的Arria FPGA晶元以及英特爾家的XMM通信晶元。不過,負責推斷的部分究竟用的谷歌自家的TPU,還是英特爾的晶元,或是英偉達的GPU,都不明朗。需要說明的是,谷歌的TPU,就是一種專用於推斷階段的ASIC。當然,在其第二代Cloud TPU上,谷歌也為其增添了深度學習訓練的能力。

而在國內,近日地平線正式發布兩款計算機視覺嵌入式AI晶元——旭日和征程,分別面向智能駕駛和智能攝像頭。這是中國首款嵌入式人工智慧晶元,相較於其他晶元,旭日和征程在性能、功耗、面積等方面都有了較大的提升,不僅可同時識別200個對象,晶元乘法器利用率峰值更高達100%,可強耦合於各種應用場景。

我們不難看出,在AI行業快速發展的當下,計算能力成為技術發展和應用落地最大的關鍵因素,而作為主要承載硬體計算功能的晶元,也隨之成為了「革新」的對象。如今AI晶元正處在不斷突破的黃金年代,創新再創新,成為現階段AI晶元的主題。


推薦閱讀:

人工智慧晶元魚和熊掌終極難題 被清華大學IC男神解決了!
神經網路加速器NVDLA頂層介面與工作流程
AI晶元之戰誰將成為人工智慧時代的最終玩家
阿里達摩院自主研發AI晶元 布局「中國芯」
國內AI晶元的先行者,寒武紀科技一直兢兢業業!

TAG:駕駛 | 自動駕駛 | 特斯拉 | AI晶元 |