揭秘華為麒麟 970:性能升級是其次人工智慧才是絕招|IFA|華為發布|麒麟970
北京時間 9 月 2 日晚上,華為消費者業務 CEO 余承東在德國的 IFA電子展的官方論壇上做了主題演講,正式發布了華為的新一代移動計算晶元——麒麟 970。
作為一款為手機設計的系統級晶元(System On Chip,即 SoC),麒麟 970 包含了所有同類產品該有的部件,比如 CPU、GPU、ISP、DSP、通訊基帶,但麒麟 970 又多了一個所有同類產品都沒有的東西——一顆為人工智慧運算專門設計的 NPU。
下面我們就 SoC 的各個部件出發,全面地了解一下麒麟 970。
CPU、GPU:重點是降功耗
如果你是一個非常看重手機 SoC 的 CPU、GPU 極限表現的『性能黨』,麒麟 970 可能不會讓你太興奮。
CPU 方面,麒麟 970 的參數相比麒麟 960 基本沒有任何變化,依然是 8 顆核心,其中 4 顆為高性能的 ARM 公版 A73 架構,最高主頻 2.4GHz(麒麟 960 是 2.36GHz),4 顆位低功耗的 ARM 公版 A53 架構,最高主頻 1.8GHz(麒麟 960 是 1.84GHz)。
有些遺憾的是,麒麟 970 並沒有用上 ARM 在今年 5 月發布的新一代 Cortex-A75、Cortex-A55 架構以及為 AI 相關運算優化的 DynamiIQ 設計(麒麟 970 選擇了另一種方法來提高 AI 運算)。當然了,考慮到 A75 和 A55 的發布時間、設計的複雜程度,麒麟 970 沒用上也是可以理解的。
在發布會上,余承東並沒有透露麒麟 970 的 CPU 性能相比 960 的變化,只是表示麒麟 970 的能耗比提升了 20%(主要得益於全新的 10 納米製程)。至於實際的性能表現,不出意外的話,麒麟 970 應該和麒麟 960 處於同一段位,不會有非常明顯的提升。
當然,橫向來看的話,麒麟 970 的 CPU 性能沒提升其實不是什麼大問題。從 GeekBench 4 等跑分軟體的得分上看,麒麟 960 的分數和高通驍龍 835、三星 Exynos 8895 基本處於同一水準,明顯強於聯發科 Helio X30。因此,即使麒麟 970 的 CPU 性能不變,也依然是 Android 陣營里移動 SoC 的頂級水準,只是不再像麒麟 960 發布時那麼領先。
相比起 CPU 上的保守,麒麟 970 在 GPU 上的『誠意』要顯得更足一些。
首先,麒麟 970 則用上了 ARM 在今年 5 月剛剛發布的 Mali-G72 架構,理論性能相比麒麟 960 上的 Mali-G71 有所提升(ARM 的官方說法是相比 G71 性能提高 20%,功耗比提升 25%)。此外,在核心數上,麒麟 970 的 GPU 也從麒麟 960 的 8 核增加到了 12 核。
實際性能上,余承東表示,相比起麒麟 960,麒麟 970 的性能有 20% 的提升,並且能效比提升了 50%。
照理說,由於麒麟 970 的 GPU 核心架構比麒麟 960 更先進,核心數還多了 50%,並且製程更先進,GPU 性能提升的幅度應該遠不止 20%。之所以出現這種情況,很可能是華為將麒麟 970 的 GPU 主頻壓得比較低,從而更好地降低功耗(於是就有了提升幅度高達 50% 的能效比)。不出意外,麒麟 960 上出現的 GPU『滿血跑』時功耗感人的情況,麒麟 970 上不會再出現。
通訊基帶:比『千兆 LTE』更快
作為一家通訊行業有著多年積累的公司,華為海思在通訊基帶上有著深厚的『家底』,特別是去年的麒麟 960,直接在 SoC 中集成了支持 LTE Cat.12/13 的 Balong 750 基帶(最大下行速度 600Mbps,上行 150Mbps),並且支持 CDMA 網路,絲毫不遜色同期的高通驍龍 820、821。
在今年的麒麟 970 上,華為海思更進一步,直接大跨步到了 LTE Cat.18,最高下載速度飆到了 1.2Gbps(4x4 MIMO,3CC CA,256QAM),也就是比之前業界最快、驍龍 835 和 Exynos 8895『千兆 LTE』還要再快上 200Mbps。
麒麟 970 還終於支持了在同時使用兩張 SIM 卡時,主副卡同時用 4G(上一代麒麟 960 的副卡只能支持 3G)。此外,麒麟 970 還特別針對高鐵時的使用做了優化,信號更穩定,減少掉線。
不過話還是要說回來,雖然麒麟 970 的通訊基帶的確是厲害,但和驍龍 835、Exynos 8895 等支持千兆 LTE 的 SoC 一樣,普通用戶想要真正體驗到這種超高速 LTE 網路,還得過上相當一段時間。
一方面,超高速 LTE 網路需要運營商的支持,雖然目前全球不少運營商(包括中國聯通)已經開始了千兆級 LTE 的測試,但距離大規模商用還仍需時日。另一方面,在手機端,除了需要 SoC 自身的基帶支持,如果要支持千兆級的 LTE,手機廠商還必須在手機的天線設計上投入額外的精力,以搭載驍龍 835 的手機為例,在目前上市的眾多驍龍 835 手機中,真正能支持到千兆 LTE 的只有三星 Galaxy S8、HTC U11 等少數國際品牌機型的部分型號。
ISP、DSP、Codec、協處理器
ISP 的全稱是 Image Signal Processor(圖像信號處理器),主要功能是處理相機感測器中收集到的數據。
麒麟 970 的 ISP 主要是一些『常規升級』,依然是雙核設計,擁有更快的速度,更快地對焦,更優秀的降噪效果,並且對運動圖像的捕捉做了優化。不過相比起單純的 ISP 升級,NPU 對相機體驗的提升可能會更大(下文會詳說)。
在 DSP、配套 Codec 等方面,麒麟 970 也有所提升,其中配套的音頻 Codec 可以支持 32bit/384k 的音頻解碼,過去幾代華為高端機(Mate、P 系列)上表現乏善可陳的內放音質,有望在麒麟 970 這代產品上獲得明顯的提升,當然前提是 Mate 10 和 P11 系列還能保留 3.5 毫米耳機插孔。
另外,麒麟 970 依然搭載了 i7 協處理器(和牙膏廠的 i7 沒啥關係),而 inSE(integrated secure element)和 TEE 安全引擎,在麒麟 970 上也都在。
在匯流排架構上,不出意外的話,麒麟 970 採用的應該是和 960 相同的 CCI-550。
10 納米製程,比驍龍 835 還多的 55 億個晶體管
製程上,不出意外,麒麟 970 用上了台積電(TSMC)最新的 10 納米工藝,這應該是繼蘋果 A10X、聯發科 Helio X30 之後,第三款採用台積電 10 納米製程的移動 SoC。
通常來說,在晶元晶體管數量相同的情況下,更先進的製程可以降低晶元的核心面積,有助於降低成本,並且更加有效地控制發熱和功耗。
在發布會上,余承東也表示,台積電的 10 納米製程可以降低 20% 的能耗,將晶元核心面積縮小 40%。
不過有趣的是,麒麟 970 的核心面積並沒有因為製程的進步而縮小,反而比麒麟 960 還要略大,這是因為麒麟 970 集成了高達 55 億個晶體管,比麒麟 960 多出了 15 億。
55 億個晶體管是什麼概念呢?大家可以參考幾個數字。
Intel 在 2014 年發布的擁有 18 個核心的至強 E5 CPU,也才內置了 55.6 億個晶體管。在更具對比價值的移動 SoC 中,以『堆料』著稱的蘋果 A10 擁有 33 億個晶體管,高通驍龍 835 擁有 31 億個。
需要說明的是,雖然晶體管數量對性能有一定的影響,並且通常是越多越好,但在晶元工藝、架構不同的情況下,我們是無法簡單地用晶體管數量來判斷性能的,尤其是在內部部件眾多的移動 SoC 中。
NPU:首款內置在手機 SoC 中的人工智慧晶元
終於到了麒麟 970 最特別的部分——NPU。
NPU 的全稱是 Neural-network Processing Unit,也就是神經網路處理單元。關於這顆 NPU 的功能,大家可以簡單理解為專門高效地進行 AI 相關計算定製的處理器,就像 GPU 之於圖形處理相關的計算,ISP 之於成像相關的計算。
傳統的 CPU(包括 x86 和 ARM)和 GPU 也是可以用來做深度學習計算的,但由於它們本身並不是專門為深度學習定製的,效率並不高。而麒麟 970 的這顆 NPU 採用了來自寒武紀(Cambricon)的 IP,專門為深度學習而定製,FP16 性能達到了1.92 TFLOP,差不多是麒麟 960 的 3 倍(0.6 TFLOP 左右)。
在發布會上,余承東展示了一張在進行 AI 運算時,NPU 和 CPU、GPU 的對比。
可以看到,性能上,NPU 是 CPU 的 25 倍,GPU 的 6.25 倍(25/4),能效比上,NPU 更是達到了 CPU 的 50 倍,GPU 的 6.25 倍(50/8)。
另外,在華為內部的測試中,麒麟 970 的 NPU 每分鐘可以識別出 2005 張照片,而不使用 NPU 的話則每分鐘只能識別 97 張(這個速度應該是用 CPU 進行計算的),優勢同樣巨大。
至於這顆 NPU 具體能實現哪些特別的功能,我們還需要等到 Mate 10、Mate 10 Pro 上來揭曉。在發布會上,余承東提到了一些 NPU 在拍照方面的應用。
具體到拍照中,NPU 可以幫助手機更精準和快速地識別拍攝場景,讓手機選擇最合適的圖像處理演算法,在雙攝背景虛化時,讓手機對邊緣虛化的處理更準確,還有最近很火的 AR 相機,NPU 可顯著提高渲染的速度,降低功耗。
再比如說,有了 NPU 之後,手機可以將語音和語義識別的部分工作轉移到手機本地,提高語音和語義識別的表現,提高手機中語音交互應用(比如語音輸入法、智能語音助手)的體驗。
值得一體的是,在發布會上,余承東還展示了『開放移動 AI 平台(Open Mobile AI Platform)』,為 app 開發者提供了包括開發者網站和社區支持、開發套件以及自家的 app 分發商店在內的『全套』服務,吸引開發者開發可以調用 NPU 性能的 app。
不過這裡有個問題,這一套方案只是針對搭載麒麟 970 的華為手機的,並不是一個開放的平台,這意味著開發者即使寫出來能調用 NPU 來實現某些強大功能的 app,也只能運行在僅有的幾款華為手機上(短期內應該只有即將發布的 Mate 10 和 Mate 10 Pro)。
至於未來華為能吸引多少開發者來利用 NPU 開發支持自家 AI 平台的 app,現在來看還是個未知數,但至少在接下來的幾個月內,恐怕更多地需要依靠華為自己的軟體工程師來開發相應的 app。
當手機 SoC 遇到 AI
對於喜歡折騰手機的用戶來說,手機 SoC 的性能可能永遠都沒有『過剩』的那一天,不過對於更多的『普通用戶』來說,隨著過去幾年裡 SoC 整體性能的不斷提升,新款 SoC 在性能上帶來的體驗加成正在變得越來越小。在 5G 時代到來之前,在移動 VR 和 AR 應用取得突破之前,這種情況很可能會一直持續下去。
在麒麟 970 上,華為探索了另外一種思路:在傳統的手機 SoC 上,額外增加一顆專門為 AI 相關運算定製的晶元(NPU),讓手機本身具備 AI 能力,完成一些和 AI 相關的應用。
至於這顆 NPU 到底能有多大的意義,我們至少還需要等到 10 月 16 日發布 Mate 10 和 Mate 10 Pro 後才能作出判斷,但可以確定的是,在 AI 席捲整個科技圈的浪潮中,麒麟 970 在 AI 上的探索只是一個開始。
今年 5 月,ARM 在發布新一代 CPU 架構Cortex-A75 和 A55 時,重點強調了提高 AI 運算能力的 DynamIQ 設計。今年 7 月,高通開放了自家的神經處理引擎(Neural Processing Engine,NPE)的 SDK,幫助開發者使用驍龍 SoC 進行 AI 相關的運算。
或許到明年這個時候,當我們在討論移動 SoC 的時候,AI 晶元就會像 CPU、GPU 那樣,成為智能手機中一個『常規』的組成部分。
推薦閱讀:
※華為手機通話音量太小?手把手教你,手機通話清晰又響亮
※華為的谷歌服務打不開怎麼辦?
※中興解禁,但通信設備國產化率到底幾何?——晶元篇
※中國抗日戰爭蘇聯空軍援華為何鮮為人知
※華為Mate 10 Pro不再遇水則慌,防水性能超乎想像