人工智慧新硬體,打開群體智能大時代
電影《超能陸戰隊》中成為大反派最大助力的「微磁機器人」可能給許多人留下了十分深刻的印象:看似簡單無力的小小機器人在達到一定數量之後,就可以自由組合成各種能夠幫助人類的神奇工具,這或許將成為未來生活的真實寫照。能夠彙集多個簡單智能機器並解決複雜問題的形式,被稱作「群體智能」。這種智能模式能夠在任何連接到互聯網,並擁有人工智慧的設備中運行,而不僅僅局限於機器人這一形式。
2017年7月公布的我國《新一代人工智慧發展規劃》中指出2020的目標之一:大數據智能、跨媒體智能、群體智能、混合增強智能、自主智能系統等基礎理論和核心技術實現重要進展,人工智慧模型方法、核心器件、高端設備和基礎軟體等方面取得標誌性成果。而現實中的群體智能例子還包括基於群體編輯的維基百科、基於群體開發的開源軟體、基於眾問眾答的知識共享、基於眾籌眾智的萬眾創新、基於眾包眾享的共享經濟等等。
基於人工智慧的新硬體,是另一種群體智能的方向。一般消費者能夠接觸到的新款智能手機、智能電視以及智能汽車,已經搭載了內置機器學習能力的晶元,這些設備能夠為用戶提供更精準的搜索和翻譯結果、圖像識別、以及駕駛輔助功能,為人們帶來諸多方便。而當這些人工智慧晶元不僅能夠接入網路,並能夠互相通信時,那麼這些人工智慧就有可能彙集成一個更大的機器智能體。這個智能體能夠解決更加複雜的問題、如城市交通、自動化倉儲管理、0日病毒及其變種的自我防禦等。然而就目前而言,並非所有的設備都內置了搭載人工智慧技術的晶元。在人工智慧發展已成不可逆的大趨勢下,為更多的設備插上人工智慧的翅膀,成為了半導體研發廠商的關鍵方向。
作為老牌半導體設計廠商,ARM也在加速AI晶元布局,為群體智能大時代的到來打好基礎。在硬體層面,ARM在2017台北國際電腦展前夕推出基於ARM DynamIQ技術的全新處理器,包括ARM Cortex-A75 CPU、ARM Cortex-A55 CPU和ARM Mali-G72高端GPU。新產品不僅為ARM晶元帶來針對人工智慧任務的技術優化,同時DynamIQ big.LITTLE還提升了晶元的配置靈活性,以適應不同強度的任務處理需求;而在軟體層面,2017年3月14日,ARM發布了免費的開源工具ARM Compute Library,其中包含適用於ARM Cortex CPU和Arm Mali GPU架構的圖像處理、計算機視覺和機器學習優化工具,開發者能夠通過這套開源工具快速高效地針對各種ARM的CPU和GPU晶元進行功能創新。
由於ARM DynamIQ技術帶來的高度靈活性,以及ARM Compute Library提供的豐富工具,使得ARM在主流級和入門級晶元中內建人工智慧技術成為可能。同時ARM考慮到,專門開發全系列的機器學習處理器之前,首先要把機器學習擴散到已有的所有晶元中,因此ARM於在3月6日在北京發布了面向主流市場和入門級市場的Mali多媒體套件,包括Mali-G52 GPU(簡稱Mali-G52)和Mali-G31 GPU(簡稱Mali-G31),以及針對顯示和視頻播放效果進行優化的Mali-D51顯示處理器以及Mali-V52視頻處理器。
其中,Mali-G52採用了8個執行引擎的設計,提升了晶元的整體吞吐量,使得圖形性能相比前代產品性能密度提高了30%;同時,Mali-G52還引入了對Int8點積加速的支持,使得該產品的機器學習能力相比上一代產品提升了3.6倍。那麼Mali-G52是如何做到大幅提升機器學習能力的呢?機器學習重要的就是要做推理演繹,即通過訓練出的機器學習演算法模型,計算出新的預測結果。而Int8點積能夠做到在不需要高位數精度運算的條件下演繹出同樣準確的推理結果,同時不消耗更多的內存和帶寬需求。因此,Mali-G52能夠在保證更優能耗的前提下大幅提升機器學習能力。
此外,隨Mali-G52同時推出的,面向入門市場的Mali-G31是目前ARM最小處理器,尺寸相比Mali-G51縮小了20%,但通過引入ARM高端產品線的Biforst架構,使得產品性能密度提升了20%;而針對屏幕顯示的Mali-D51顯示處理器在無縫、高效內容投射方面,內存訪問延遲性能提升50%;針對視頻播放優化的Mali-V52視頻處理器能使所有主流設備的解碼性能提升兩倍,實現4K流暢播放。通過這些GPU、顯示處理器和視頻處理器,配合ARM具有高度配置靈活性的DynamIQ處理器產品,ARM SoC能夠分別為高端級、主流級和入門級處理器產品帶來更高的性能,同時也將人工智慧帶到了主流用戶身邊。
人工智慧正不斷改變人們的日常生活。ARM針對人工智慧晶元的發展也遠未止步。2018年初,ARM正式公開Project Trillium,該項目包含一組高度可擴展處理器的ARM IP組合:ARM機器學習處理器和ARM目標檢測處理器。這兩項產品均為移動設備設計,並提供增強的機器學習和神經網路功能。其中,ARM機器學習處理器可以提供每秒超過4.6萬億次的運算能力;ARM目標檢測處理器是專門為高效識別人或物體而設計,在全高清解析度下可以做到實時每秒60幀的檢測,性能可以達到傳統DSP的80倍。此外,配合ARM Compute Library和符合ARM Cortex微處理器軟體介面標準的神經網路內核CMSIS-NN,ARM神經網路(NN)軟體庫專門為神經網路運算(NN)進行了優化,並可無縫地把TensorFlow、Caffe和Android NN等神經網路框架和全系列的ARM Cortex CPU、ARM Mali GPU和機器學習處理器高效連接在一起。未來,ARM機器學習產品系列還將滿足不同應用場合的需求,包括從感測器、智能音箱,到移動設備、家庭娛樂以及其它領域的應用。
根據IDC的一項調查顯示,在所有已經出貨並具有人工智慧的產品中,90%是基於ARM技術。這表明ARM已然將人工智慧技術納入自己的產品核心戰略之中。ARM副總裁暨計算產品事業部總經理 Nandan Nayampally曾表示:「考慮到ARM技術已被全球70%的人口所使用,實現安全的、無處不在的人工智慧已經成為ARM的基礎指導性設計原則……為此,我們需要賦予從網路節點到雲端的計算以更快速、更高效和更安全的分散式智能(Distributed Intelligence)。」很明顯,ARM也正將人工智慧與雲計算相結合,彙集各種搭載人工智慧技術設備的點滴智能,打開群體智能大時代的大門。(文/子仝)
推薦閱讀:
※雲計算九條定律
※什麼是雲支付?
※RDS For MySQL常見連接問題總結
※智慧城市的互聯網雲腦架構,7種城市神經反射弧的建設是重點
※為什麼選擇雲計算