ARM發布了兩款AI晶元設計,為機器學習而生
英國晶元廠商ARM推出了兩款最新處理器設計,帶著定製硬體加入了人工智慧的戰場。它承諾,將為研發機器學習設備的公司提供「革命性的計算能力」。
這些設計適用於ARM機器學習處理器,它能夠加速一般的人工智慧程序,從機器翻譯到面部識別均可適用。它還適用於ARM對象檢測處理器,這是專為處理可視數據,以及檢測人員和物品而優化的第二代設計。對象檢測處理器將在本月底提供給商業客戶,而機器學習處理器將在今年年中推出。
ARM官方表示,這款處理器理論上在1.5W功率下可以超過4.6TOP的吞吐量,最高能達到3TOP/W。ML處理器可以作為一個完全專用的獨立IP模塊,它有自己的ACE-Lite介面,可以集成到SoC中,也可以集成到DynamiQ集群中。這就意味著吞吐量高低並不是其性能的直接表現形式,只能作為一種參考。
圖丨對象檢測處理器
除此之外,ARM的機器學習處理器還搭載了最新的對象檢測處理器。這是一種針對物體檢測進行優化的傳統視覺處理器,雖然機器學習處理器可以通過神經網路完成相同的任務,但OD處理器(Object Detection Processor)在面對特定問題時效率更高,因此ARM方面仍選擇搭載此配置。
ARM的機器學習副總裁Jem Davies表示:「這些都是全新設計,不是基於現有的CPU或GPU架構。」
與所有的ARM晶元一樣,ARM不會自己製造處理器,而是將設計授權給第三方製造商。過去,ARM的客戶包括Broadcom等晶元製造商,還包括像蘋果這樣的硬體公司,他們會為了自己的設備調整ARM的(晶元)設計。機器學習處理器將主要吸引平板電腦和智能手機製造商的興趣,而對象檢測處理器可能被用於更廣泛的用途,從智能安防攝像機到無人機。
Davies表示,有許多對「機器學習晶元」感興趣的手機製造商,ARM已經與它們進行了會談,但不會透露任何具體的公司信息。目前,特製的人工智慧處理器僅出現在高端設備上,例如蘋果iPhone X和華為Mate 10。但是,Davies相信,隨著人工智慧應用的普及,這些晶元將迅速成為各個價格區間設備的標準配置。
「通過與市場的對話,我們相信它的普及速度會非常非常快。」Davies表示。「在中國,他們已經在談論從明年開始將其應用在入門級智能手機上。」
這些晶元設計不僅適用於智能手機,而且將有助於推動下一代物聯網(IoT)設備的發展。和許多開發人工智慧晶元的公司一樣,ARM對邊緣計算的重要性進行了大規模宣傳——這意味著要在設備上進行本地化運算,而不是將數據發回雲端計算。這已經成為手機製造公司採用人工智慧晶元的一個重要因素,因為相比雲計算,設備上的本地運算具有許多優勢。首先本地運算更安全,因為數據無法在傳輸中被攔截。其次它更快更可靠,因為用戶不必等待遠程伺服器處理其數據。最後,用戶和供應商的成本都較為低廉。
「谷歌表示,如果每個用戶每天只用3分鐘的語音搜索,那麼他們將不得不加倍伺服器數量。」Davies說。隨著越來越多的智能設備開始運行計算量更大的人工智慧程序,「網路上將沒有足夠的可用帶寬,互聯網將會被破壞」。Davies補充說,儘管目前的晶元設計是針對移動設備的,但是更廣泛的晶元架構可以擴展到伺服器上的人工智慧晶元。
Moor Insights & Strategy首席分析師PatrickMoorhead表示,面對繁重的計算任務,越來越多的公司開始從聘請分析師轉向研究機器學習,新的晶元設計對ARM來說意義重大。不過,他認為這些晶元對移動行業的影響是有限的。Moorhead表示:「移動市場目前表現平穩,我認為這種新型技術將有助於推動消費者更新(升級他們的手機),但不會使智能手機銷量再次大規模增長。」
當然,ARM並不是唯一一家試圖通過優化晶元,在人工智慧領域弄潮的公司。高通正在開發自己的人工智慧平台,英特爾去年推出了一系列新的人工智慧特製晶元,谷歌正在為其伺服器研發機器學習晶元,並試圖在這動蕩時期佔據優勢。同時,像Graphcore這樣的雄心勃勃的創業公司也在進軍,並由風險投資推動,渴望顛覆現有的巨頭。
正如Davies所說的那樣,這是一個「時代性的變革」,幾乎影響世間一切,「包括所有需要計算的領域」。
推薦閱讀:
※Perceptual loss for Real time Style Transfer and Super-Resolution 論文閱讀
※關於不平衡數據集以及代價敏感學習的探討
※BOW 演算法,被CNN 打爆之前的王者
※機器學習入門之邏輯回歸分類
※打開機器學習的黑盒——卷積神經網路原理介紹