智能晶元+解決方案,遙望地平線的余凱能否迎來曙光?

本文由 【AI前線】原創,原文鏈接:dwz.cn/77f3H2

編輯 | Vincent

AI 前線導讀:「今天,地平線機器人科技舉辦了產品發布會,在會上公布了該公司自主研發的嵌入式智能視覺晶元,同時發布三個智能解決方案,分別面向:智能駕駛、智能城市以及智能商業。

沉寂許久之後,這是地平線第一次公開發布新產品,對於關注地平線許久的人來說,這無疑是一爆炸性的新聞。離開百度之後,走上創業之路的余凱終於在今天用實力展示了地平線布局 AI 的決心和志向,遙望「地平線」許久的他,能否如願看到屬於自己的光芒萬丈?」

2017 年 12 月 20 日下午 14:00,北京,中國大飯店。

地平線機器人科技在其產品發布會上,發布了號稱中國首款、全球領先的嵌入式人工智慧視覺晶元 BPU(Brain Processing Unit):面向智能攝像頭的「Sunrise」旭日處理器和面向智能駕駛的「Journey」征程處理器。

地平線機器人技術創始人,前百度深度學習研究院領導人余凱博士在會上表示:早在 2015 年,地平線公司創立之時,就在行業中率先提出:打造人工智慧晶元架構(BPU),比谷歌提出 TPU 架構的時間更早。

據介紹,該晶元功耗可低至 1.5W,能夠同時對行人、機動車、非機動車、車道線、交通標誌牌、紅綠燈等 8 類目標進行精準的實時檢 測與識別。

除此之外,地平線還在會上公布了三個智能解決方案,分別面向:智能駕駛、智能城市以及智能商業,後兩個解決方案將應用地平線的嵌入式人工智慧視覺晶元,集合獨有的的深度學習演算法,在前端能夠實現大規模人臉檢測跟蹤、視頻結構化等應用,可廣泛用於智能安防、智慧城市等場景。

AI 前線在現場得到了地平線此次發布晶元的詳盡參數:

該晶元基於高斯架構,可以完成一路 1080P@30fps 的視頻輸入,可對毎幀圖像中的 200 個目標進行檢測識別;典型功耗僅為 1.5W,並且延時小於 30ms

同時,余凱博士還在現場公布了未來幾年地平線在晶元領域的戰略:

2018 年,地平線將推出基於伯努利架構,擁有新型稀疏二值化神經網路結構的新款智能晶元;2019 年,將推出可同時處理 12 路 4K@30fps 視頻輸入的高性能晶元。

到 2025 年,中國道路上 3 千萬新車都將具備自動駕駛功能,每輛自動駕駛汽車的「大腦」都基於地平線的人工智慧處理器。

地平線醞釀許久的「大招」

自 2015 年 7 月成立以來,地平線目前已經發布了車道線 / 車輛 / 行人檢測的智能駕駛輔助系統、 「安徒生平台」兩款智能系統,分別應用在智能駕駛和智能家居領域。2016 年 7 月,在獲得了新一輪融資後,地平線方面曾表示,這筆投資將用來加大對自動駕駛和智能家居領域的研發投入,加快產品研發和落地速度;推進人工智慧晶元和系統的研發。在此後的 2016 年 9 月,地平線成立了南京研發中心,智能晶元的研製開始步入正軌。

從 2016 年 9 月到 2017 年 12 月這一年多的時間裡,地平線彷彿從技術領域失蹤了一般,對外不再放出半點消息,甚至一度引發外界猜想:如今已是戰場一般的 AI 領域,地平線是否還能繼續生存下去?

終於,在 2017 年 12 月,AI 前線收到來自地平線的邀請,前來參加本次的產品發布會。當了解到新品發布極有可能是晶元的時候,我們明白了:原來一直潛心鑽研,默不作聲的地平線是在醞釀這樣的一個「大招」。

晶元大招已發,戰場上能否絕殺?

現在,地平線的晶元也已發布,大招已發,但在這已經颳起風暴的智能晶元戰場上,能否起到一擊必殺的效果呢?縱觀全球,在智能晶元領域進行布局的技術企業都已搶佔了各自的山頭,我們來看看目前 AI 戰場的戰況:

國外戰場主要以大廠為主要戰鬥力,Intel、Nvidia、Google、Microsoft 四家老牌技術大廠各自佔據一片沃土,布局 AI,瘋狂生長,頗有些巨頭爭霸的態勢。

Intel——老牌晶元廠試圖煥發新機

自動駕駛車輛已經成為人工智慧的主要目標之一,而 Intel 想要在這一領域牢牢鞏固自己的地位。

然而,Intel 並沒有把全部的精力放在內部研發上,而是通過收購來構建自身的 AI 能力。2016 年 8 月,Intel 收購了神經網路處理器製造商 Nervana Systems。

2016 年 11 月,在收購 Nervana 幾個月後,Intel 宣布推出一系列處理器——Nervana,一個直接針對人工智慧相關應用,如訓練神經網路的平台。Intel 數據中心事業部執行副總裁兼總經理 Diane Bryant 說道:「我們期望 Intel 的 Nervana 平台再性能上能夠有所突破,並大大縮短訓練複雜神經網路所需的時間。預計十年之內,Intel 的性能將提高 100 倍,加速新興的深度學習領域創新的步伐。「

2017 年 3 月,Intel 又高調地收購深度學習 ADAS 開發商 Mobileye,收購總額約為 150 億美元。Intel 的併購戰略幾乎立即產生重大意義。這家晶元製造商希望在自動駕駛車輛領域佔有一席之地,而且這一戰略也讓其一躍成為機器學習硬體的關鍵供應商。

去年 11 月在洛杉磯舉行的 Automobility LA 貿易展覽會上,Intel CEO Brian Krzanich 稱,自動駕駛已成為如今最大的 game changer,並宣稱 Intel 在收購 Mobileye 公司後推出的新產品 SoC 和 EyeQ5,比其最大的競爭對手——Nvidias Xavier 的深度學習平台性能提高兩倍。

Nvidia——獨霸 GPU,傲視群雄

雖然市場上有不少 GPU 公司,但沒有哪家公司比 Nvidia 作為這個技術的代名詞更貼切。根據 Jon Peddie 研究公司的報告,Nvidia 在 2017 年第三季度的 GPU 出貨量增長了 29.53%,主要競爭對手 AMD 和 Intel 在這方面均敗下陣來。AMD 的出貨量增加了 7.63%,而 Intel 的出貨量增加了 5.01%。當然,這主要是由於視頻遊戲市場的推動,但 Jon Peddie Research 的分析師認為,與加密貨幣挖掘有關的應用程序對高端性能的需求,也對出貨量增長做出貢獻。

對於高性能任務處理器(如加密貨幣挖掘和 AI 應用程序)的需求,將 GPU 推向了 AI 硬體的最前沿。GPU 包含數百個可同時執行數千個軟體線程的內核,而且比 CPU 更節能。CPU 比較泛化,且更具有跳躍性,可以執行很多任務,並擅長對大批量數據進行重複操作。GPU 之所以被稱為 GPU,就是因為這一關鍵區別,它更擅長處理圖形——因為圖形處理涉及一次性處理數以千計的小計算。同時,這樣的性能也使得 GPU 成為理解上述神經網路訓練等任務時的理想選擇。

就在今年 12 月,Nvidia 宣布推出了一款專為深度學習而設計的 PC GPU——Titan V。這款 GPU 基於 Nvidia 的 Volta 架構,使用了 Nvidia 稱之為 Tensor Cores 的新型核心技術。在數學術語中,張量(tensor)的定義為「與矢量相似,但更泛化的數學對象,用一組空間坐標函數表示。」Nvidia 所做的,是針對處理深度學習和神經網路計算的需求,開發具有複雜架構的內核。

Google——專註 TPU,做好應用落地

也許沒有哪家公司比 Google 對張量概念的研究更加深入。2016 年,這家搜索巨頭髮布了非常流行的深度學習開源框架 TensorFlow。如 Google 所說,「TensorFlow 是一個使用數據流圖進行數值計算的開源軟體庫。圖中的節點表示數學運算,而圖像邊緣表示在它們之間通信的多維數組(張量)。它靈活的體系結構讓用戶可以使用單個 API 將計算部署到桌面、伺服器或移動設備中的一個或多個 CPU 或 GPU。「

2016 年,該公司發布了第一代被稱為張量處理單元(TPU)的新處理器。Google 的 TPU 是專為機器學習和 TensorFlow 而量身定製的 ASIC。2017 年 5 月,Google 發布第二代 TPU,並稱其性能高達 180 teraflops。

2017 年 6 月,在加拿大多倫多舉行的第 44 屆計算機體系結構國際研討會(ISCA)上,Google 發布了一項研究報告,將其部署在數據中心的 TPU 與 Intel Haswell CPU,以及部署在同一數據中心的 Nvidia K80 GPU 進行了比較,結果發現,TPU 比 GPU 和 CPU 運行速度平均快 15 到 30 倍。TPU 的 TOPS per watt 也比後兩者高約 30 到 80 倍。Google 表示,現在,TPU 已經用於該公司所有在線服務,如搜索、街景、Google 相冊和 Google 翻譯服務中。

在一些非常高端的 AI 應用中,TPU 也已經證明了其價值。TPU 是谷歌著名的 AlphaGo AI 背後的「大腦」,AlphaGo AI 去年擊敗了圍棋世界冠軍,而最近,AlphaGo 通過證明其能夠在相對較短的時間內,通過自學成為圍棋大師,從而實現了人工智慧領域的巨大的飛躍。經過短短几個月的訓練,AlphaGo 的最新版本 AlphaGo Zero 的能力就遠遠超過人類專家。而戰勝國際象棋(一個複雜的遊戲,但是比 Go 計算量小得多)專家,也就是幾個小時的事情。

Microsoft——後來居上的黑馬

雖然 Nvidia、Google 以及 Intel 在某種程度上都專註於為 AI 服務,但其晶元提供的服務處理過程均發生在設備上,而不是雲端。微軟聲稱,其 FPGAs 雲端人工智慧服務的性能與 Nvidia、Google 以及 Intel 相當,甚至更優。微軟認為,這款代號為 Project Brainwave,基於 FPGA 的雲端解決方案,在可擴展性和靈活性方面將優於 CPU、GPU 和 TPU。

一般來說,基於處理器的解決方案在某種程度上會受到設計上的限制,僅能完成特定的任務。但是,由於 FPGA 具有靈活性和可重編程性,讓升級更容易,處理器的性能更高。根據微軟的說法,在 Intel Stratix 10 FPGA 上運行時,微軟的 Project Brainwave 的運行速度達到 39.5 teraflops,延時不足 1 毫秒。

FPGA 是否能為人工智慧提供最佳解決方案,與其他議題一樣是值得商榷的事情。微軟認為,創造 AI 專用 ASIC 的生產成本太高,而另一些人則認為,FPGA 永遠無法完全實現專為 AI 設計的晶元性能。

3 月份舉行的 International Symposium on Field Programmable Gate Arrays (ISFPGA) 上,一些 Intel 加速器架構實驗室的研究人員發表了一篇論文,稱其對處理深度神經網路演算法的兩代 Intel FPGA(Arria10 和 Stratix 10)和 Nvidia Titan X Pascal (Titan V 處理器)進行了比較。據 Intel 研究人員稱:「研究結果顯示,在 pruned、Int6 和二值化 DNNs 矩陣乘法運算方面,Stratix 10 FPGA 的性能(TOP / 秒)比 Titan X Pascal 圖形處理器的性能分別高 10%、50% 、5.4 倍。在 Ternary-ResNet 方面上,Stratix 10 FPGA 比 Titan X Pascal GPU 的性能高 60%,而且性能功耗比高 2.3 倍。這表明,FPGA 可能成為加速下一代 DNN 的首選平台。「

反觀國內,雖不如國外那般龍爭虎鬥,但初創企業的力量也是不容小覷的。

寒武紀在今年發布了三款智能晶元:面向低功耗場景視覺應用的寒武紀 1H8、擁有更廣泛通用性和更高性能的寒武紀 1H16,以及面向智能駕駛領域的寒武紀 1M。此外,更有深鑒科技、Kneron、鯤雲科技等初創企業也在專註智能晶元的研究,地平線目前的處境不敢說是草木皆兵、四面楚歌,但也絕不是佔據十分有利的條件的。

地平線的雄心

在晶元之外的三套智能解決方案,也許更能體現地平線的雄心壯志。

不論是今年 Nvidia 的 GTC China 2017 大會,還是之後的百度世界大會,無數企業都提到要開始進行智慧城市的布局,今天,地平線也加入了這一隊伍。

我們在文章開頭提到,地平線早在 2016 年就已經在智能駕駛領域提供解決方案,余凱博士也在演講中說了這樣一句話:自動駕駛處理器對準確性、功耗、實時性、可靠性的要求之高代表了人工智慧處理器的珠穆朗瑪峰。 隨著自家智能晶元的發布,地平線在智能駕駛、智慧城市等領域的發展有了更加充足的底氣。

此次新品發布,讓地平線重歸人們的視野,而新發布的智能晶元能否得到業內的認可尚處於未知的狀態,是一石激起千層浪,還是如同沙礫一般被大海吞沒?AI 前線將持續關注地平線的最新動態,地平線是否擁有絕對實力來佔據國內晶元市場的一席地位,我們十分期待光芒從地平線綻放的時刻。

有關 2018 年晶元之戰的詳細分析,請查看我們今日發布的第三條內容《2018 年,AI 晶元之戰將打響》,同時敬請關注 AI 前線年終智能晶元專題內容!

關注我們的微信號"AI前線",後台回復「AI」可獲得《AI前線》系列PDF電子書


推薦閱讀:

如何開始系統全面地學習園林景觀方案?
最近看裝修,聽朋友推薦的貓舍裝飾,想問問怎麼樣啊?
智能茶几方案有哪些內容開發要多久?怎麼做?

TAG:智能硬件 | 方案 |