人加智能實測-不可比擬的迭代能力FPGA就是這麼神

看點:在一片紅海的 AI 晶元市場里,FPGA 已悄然殺出一條生路。

全文3000字,預計閱讀時間8分鐘。

本文部分市場調研轉自智東西

導語:「AI晶元」這個新鮮的概念在過去一年間逐漸走過了普及的階段,越來越被大眾所熟知。隨著大數據發展和算力的提升,AI 晶元正迎來新一輪的爆發期。在一片紅海的 AI 晶元市場中,FPGA 憑藉自己獨特的優勢佔有了一席之地。甚至有媒體報道稱,FPGA 是 AI 晶元的終極未來。

FPGA相對於ASIC的優勢

FPGA(Field-Programmable Gate Array)即現場可編程門陣列,其靈活性介於CPU、GPU等通用處理器和專用集成電路 ASIC 之間,在硬體固定的前提下,允許使用者靈活使用軟體進行編程。它的開發周期比 ASIC 短,不過相對於批量出貨ASIC,單個 FPGA 的成本會更高。

近兩年來,越來越多以 FPGA 切入 AI 晶元的玩家湧現出來,包括國內 AI 晶元創企深鑒科技、百度XPU、微軟Project Brainwave等等。

儘管 ASIC 在性能功耗上往往有更好的表現,但 FPGA 容錯空間相對更大,以前 FPGA 常被用作 ASIC 晶元流片前的硬體驗證方法。目前,業內的主流觀點是:隨著 AI 演算法的進一步成熟固化,AI 晶元最終會走向 ASIC——也就是較為固定的晶元架構。

不過,賽靈思 CEO Victor Peng 持有不同觀點,他告訴智東西,AI 演算法迭代、應用創新的速度還將持續很長一段時間,甚至會維持 10-20 年之久,因此一款靈活、可應變的計算平台將成為創新的重中之重。

而且,未來最終並不會是一款 AI 晶元架構統一天下的局面,我們越來越需要能夠適應眾多 AI應用、適應不斷變化的 AI 演算法的新型晶元架構出現。

與此同時,英特爾可編程解決方案事業部亞太區市場拓展經理劉斌也認為, FPGA 在所有市場領域裡都會佔有一定的市場份額,從原生市場環境而言,FPGA 和 ASIC 都有一個競爭合作的共生環境。

「專用的 ASIC 其實還是非常有競爭力的,」劉斌表示,「不過 FPGA 是在所有的垂直市場都會有一定的份額,這種靈活性和普適性是 FPGA 最主要的價值。」

人加智能的FPGA開發心得

人加智能在雙目硬體化產品研發之初就堅定的選擇了基於 FPGA 的方案,主要基於以下幾個方面原因。

1. 加速能力

對於一個完整的具備本地處理能力的雙目系統通常如圖所示,包含圖中幾個部分。

完成 Stereo Vision Processing System 的嵌入式平台當下通常有四種選擇:其一為通用的嵌入式 CPU 系統,通常為 SOC 設計,如瑞芯微的 RK3288/RK3399、高通的驍龍 820 平台均為當下比較強勁的嵌入式處理平台,此類平台具備相對比較強大的計算能力、比較豐富的相機數據輸入介面和 ISP 能力,對於雙目成像來說確實是一個比較優的選擇,但對於雙目系統中兩個比較關鍵的計算(畸變校正/立體校正與立體匹配)來說基本上能算上是有心無力,其複雜度之高對於諸如 Intel 的高端 CPU 來說也是望而卻步。因此對於此類平台而言,通常用於雙目成像。

其二為集成 GPU 的潛入式系統,比較典型的代表為 Nvidia TK1/TX1/TX2平台,其集成比較強大的 GPU 核心,對於此類平台而言,已經具備強大的並行能力,對於運算複雜度比較高的立體匹配模塊而言已具備實時的處理能力,然而其昂貴的價格和較高的功耗,使得基於此類設計的方案的適用性大大降低。

其三為 DSP 系統,DSP 為傳統圖像處理的一個相對主流平台,但此平台一般應用在工業領域。

其四為 FPGA 平台,FPGA一直因為其高昂的價格和設計難度讓人望而卻步,以至於很多人一聽說是 FPGA 的方案基本上內心篤定此方案一定無法面向消費市場。實際情況並非如此,FPGA 的成本與設計使用的資源有很大關係,資源越多則需要更高成本的 FPGA。因此演算法屬性和設計能力決定了所選用 FPGA 的成本。人加智能在 FPGA 演算法設計上積累了近十年的經驗,依託此能力,人加智能在一個較低成本的 FPGA 上完成了整個立體視覺系統,依託強大的設計能力,將演算法設計為完全的流水線和並行的電路級加速處理架構,即達到了每秒VGA@100fps 的處理能力,又做到了「輸入即輸出」的零延時處理方案,使得對於實時性要求很高的場景均可得益於雙目技術,如人加智能自主研發的無人機雙目避障系統。

2. 迭代能力

當下的視覺演算法已經應用在各行各業中,各個行業甚至於同一行業不同場景對於特定演算法的要求均有區別,很難做到一次開發,面向所有場景的適配。演算法的高複雜度決定了需要專用加速核來處理,同時演算法在面向具體場景落地時往往需要升級與迭代,因此將演算法固化於一個專用ASIC 晶元中不是一個很好的主意,FPGA 在此方面擁有強大的靈活性,實時的可以做到硬體可編程,在保證演算法的加速性能前提下做到硬體加速核動態可重構,這是很多晶元都無法比擬的。尤其是人加智能在探索性開發無人機自主飛行要求的避障系統、人體 3D 行為分析系統的過程中,都對演算法進行了上百次的迭代,才滿足並超越了客戶的期望。

3. 擴展能力

目前的FPGA逐漸已經發展為比較強大的 SOC 系統,具備通用CPU、指令集加速、嵌入式GPU、Video Codec,當然也包含極其重要的可編程邏輯資源,所有資源可通過片上網路進行片內高速互聯。這個能力在物聯網時代,尤其珍貴。使得設計 FPGA 在應用上的擴展能力大大提升,這也是各個巨頭均一定程度上採用 FPGA 作為 AI 加速的的原因。換句話說,保留通用計算能力,同時具備動態可重構 AI 加速核的潛入式計算機形態也是今後發展的一個重要趨勢。

FPGA AI 晶元市場受到企業青睞

近兩年來,市場對 FPGA 的反饋也越來越基金,尤其是 FPGA 在數據中心的應用日益廣泛。目前,FPGA 伺服器已在全球七大超級雲計算數據中心 IBM、Facebook、微軟Azure、AWS、百度雲、阿里雲、騰訊雲得到部署。由於 ASIC 路線風險高,目前僅有谷歌批量部署TPU。

這裡面尤其要說下最會玩 FPGA 的微軟AI:BrainWave項目,微軟 Azure 與 FPGA 的淵源可以追溯到八年前,當時的 Bing(必應)搜索引擎無論是搜索結果還是相應速度都比不過谷歌搜索。為了滿足 Bing 的需求,2010 年底,一位微軟研究員提出了能在 FPGA 上運行 Bing機器學習演算法的硬體設計得到了微軟的認可。

如今,FPGA 在加速數據處理方面的出色表現使它在微軟 Bing、Azure 雲計算服務和 Office 365 中均得到部署。

今年3月26日,微軟Bing官方微博宣布通過英特爾 Arria FPGA 和 Stratix FPGA 晶元打造出Project Brainwave 深度學習加速平台。該平台將 DNN 處理單元整合入 FPGA,支持微軟Cognitive Toolkit、谷歌 Tensorflow 等流行深度學習框架的軟體棧,能夠執行 Bing 智能搜尋功能所需的大規模機器閱讀理解任務。

在5月微軟 Build 2018大會上,微軟 AI 晶元 Brainwave 開放了雲端試用版,開發者現在可以接入微軟 Azure 雲,試用由 Project Brainwave 晶元計算平台提供的 AI 服務。微軟稱其延遲比谷歌TPU低5倍,正面對標谷歌。Project Brainwave 可以看作微軟基於英特爾 FPGA 晶元打造的低延遲 AI 晶元。

總的來說,微軟基於 FPGA 打造的 AI 晶元是目前業內最認可的 FPGA 方案之一。

近年來,賽靈思和英特爾在中國雲服務市場可謂是動作頻頻,和華為雲、阿里雲、騰訊雲等國內頂尖的雲計算服務提供商也分別展開合作。

FPGA 在 AI 晶元行業呈現出的發展趨勢

目前 FPGA 在 AI 晶元行業呈現出的發展趨勢一共有三個:一是將 FPGA 作為跳板,逐步轉向專用定製晶元 ASIC,二是最大化程度挖掘 FPGA 的使用疆域,三是在 FPGA 的基礎上推出優化架構。

1、基於 FPGA 優化架構

基於 FPGA 進行優化架構的發展路線以賽靈思為代表。面對價格貴、開發難度大的問題,今年3月,賽靈思發布歷時4年、投入超過 10 億美元打造的新一代 AI 晶元架構 ACAP,直接宣戰英偉達、英特爾處理器,對此智東西曾做深入報道(首發!賽靈思推顛覆性 AI 晶元 正面宣戰英偉達英特爾)。

2、長期最大化使用 FPGA

但至少在在深度學習演算法穩定前,FPGA 都有其生存空間。因為很多公司都發現,剛做完傳統演算法硬化,過了半年,內部演算法團隊又把演算法換了。

深思考 CEO 楊志明接受智東西採訪時認為,FPGA 與 ASIC 融合是AI計算的未來。單純的 ASIC 晶元無法完全替代 FPGA,也不具備 FPGA 的靈活性。就如同 ASIC 到現在都無法在傳統領域完全替代 FPGA 一樣,在 AI 領域,FPGA 與 ASIC 也會分而治之。智慧工業機器人、智慧通信、智慧醫療、智慧裝備等領域都是除 FPGA 以外的其他 AI 晶元難以介入的應用領域。

3、深度學習加持,FPGA 會被長期大量使用

最近一年,AI 晶元踏入紅海,除了賽靈思、英特爾等傳統晶元巨頭外,國內外眾多 AI 晶元創企也紛紛加入戰場。FPGA 的可編程性使軟體和終端應用公司能夠根據演算法靈活修改解決方案,這讓它在 AI 晶元市場愈發有存在感。

當下 AI 仍處於早期階段,AI 演算法正從訓練環節走向推理環節,這個過程需要對訓練後的模型進行壓縮,在基本不損失模型精度的情況下將模型壓縮到原來的幾十分之一。在這一階段,AI 是向著有利於 FPGA 發展的方向進行優化和升級的。

FPGA 或許只是小眾的晶元,但在 AI 市場上,它的普適性和靈活性都使其有適合發揮其優勢的應用場景。在各類 AI 晶元之間沒有拉開絕對差距之前,每一種技術路線都有其發揮更多價值的空間。


推薦閱讀:

TAG:能力 | 科技 | 現場可編輯邏輯門陣列(FPGA) |