華為麒麟 970 國內發布,這些 AI 應用是否會變革智能手機?

文 | 賈伯斯龍

9 月 25 日上午,華為在北京召開了麒麟 970 的媒體溝通會,這也是麒麟 970 在國內的首次亮相。和本月初在德國 IFA 電子展的首秀相比,在這一次的國內溝通會上,華為公布了麒麟 970 更多的技術細節和具體應用。

作為一款為手機設計的系統級晶元(System On Chip,即 SoC),麒麟 970 自然包含了常規的手機 SoC 該有的部件,比如 CPU、GPU、ISP、DSP、通訊基帶,但和同類產品相比,麒麟 970 又多了一個所有同類產品都沒有的東西——一顆為人工智慧運算專門設計的 NPU。

下面我們就 SoC 的各個部件出發,全面地了解一下麒麟 970。

CPU、GPU:重點是降功耗

CPU 方面,麒麟 970 的參數相比麒麟 960 基本沒有任何變化,依然是 8 顆核心,其中 4 顆為高性能的 ARM 公版 A73 架構,最高主頻 2.4GHz(麒麟 960 是 2.36GHz),4 顆位低功耗的 ARM 公版 A53 架構,最高主頻 1.8GHz(麒麟 960 是 1.84GHz)。有些遺憾的是,麒麟 970 並沒有用上 ARM 在今年 5 月發布的新一代 Cortex-A75、Cortex-A55 架構以及為 AI 相關運算優化的 DynamiIQ 設計(麒麟 970 選擇了另一種方法來提高 AI 運算)。當然了,考慮到 A75 和 A55 的發布時間、設計的複雜程度,麒麟 970 沒用上也是可以理解的。

華為表示,表示麒麟 970 的能耗比提升了 20%(主要得益於全新的 10 納米製程),至於實際的性能表現,不出意外的話,麒麟 970 應該和麒麟 960 處於同一段位,不會有非常明顯的提升。當然,橫向來看的話,麒麟 970 的 CPU 性能沒提升其實不是什麼大問題。從 GeekBench 4 等跑分軟體的得分上看,麒麟 960 的分數和高通驍龍 835、三星 Exynos 8895 基本處於同一水準,明顯強於聯發科 Helio X30。因此,即使麒麟 970 的 CPU 性能不變,也依然是 Android 陣營里移動 SoC 的頂級水準,只是不再像麒麟 960 發布時那麼領先。

相比起 CPU 上的保守,麒麟 970 在 GPU 上的「誠意」要顯得更足一些。

首先,麒麟 970 則用上了 ARM 在今年 5 月剛剛發布的 Mali-G72 架構,理論性能相比麒麟 960 上的 Mali-G71 有所提升(ARM 的官方說法是相比 G71 性能提高 20%,功耗比提升 25%)。此外,在核心數上,麒麟 970 的 GPU 也從麒麟 960 的 8 核增加到了 12 核。

華為表示,相比起麒麟 960,麒麟 970 的性能有 20% 的提升,並且能效比提升了 50%。照理說,由於麒麟 970 的 GPU 核心架構比麒麟 960 更先進,核心數還多了 50%,並且製程更先進,GPU 性能提升的幅度應該遠不止 20%。之所以出現這種情況,很可能是華為將麒麟 970 的 GPU 主頻壓得比較低,從而更好地降低功耗(於是就有了提升幅度高達 50% 的能效比)。

實際的表現也印證了我們的猜測,根據現場的介紹,麒麟 970 的 Mali-G72 最高主頻為 700MHz,相比麒麟 960 的 900MHz(部分場景下會飆到 1000MHz 左右)有明顯的下降,這種「多核 + 低頻」的策略讓麒麟 970 在性能有一定提升的同時,功耗得以大幅度降低。

通訊基帶:比「千兆 LTE」更快

作為一家通訊行業有著多年積累的公司,華為海思在通訊基帶上有著深厚的「家底」,特別是去年的麒麟 960,直接在 SoC 中集成了支持 LTE Cat.12/13 的 Balong 750 基帶(最大下行速度 600Mbps,上行 150Mbps),並且支持 CDMA 網路,絲毫不遜色同期的高通驍龍 820、821。

在麒麟 970 上,華為海思更進一步,直接大跨步到了下行 LTE Cat.18(上行最高 Cat.13),最高下載速度飆到了 1.2Gbps,也就是比之前業界最快、驍龍 835 和 Exynos 8895「千兆 LTE」還要再快上 200Mbps。

麒麟 970 還終於支持了在同時使用兩張 SIM 卡時,主副卡同時用 4G(上一代麒麟 960 的副卡只能支持 3G),任意一張卡都可以使用 VoLTE 通話。此外,麒麟 970 還特別針對高鐵時的使用做了優化,信號更穩定,減少掉線。

不過話還是要說回來,雖然麒麟 970 的通訊基帶的確是厲害,但和驍龍 835、Exynos 8895 等支持千兆 LTE 的 SoC 一樣,普通用戶想要真正體驗到這種超高速 LTE 網路,還得過上相當一段時間。

ISP、DSP、Codec、協處理器

ISP 的全稱是 Image Signal Processor(圖像信號處理器),主要功能是處理相機感測器中收集到的數據。

麒麟 970 的 ISP 主要是一些「常規升級」,依然是雙核設計,擁有更快的速度,更快地對焦,更優秀的降噪效果,並且對運動圖像的捕捉做了優化。另外,針對目前很火的人像拍攝,麒麟 970 的 ISP 進行針對性的優化,可以根據不同膚色、帽子、眼睛、口罩、遮擋、側臉等多種複雜的人臉場景進行優化,改善了人像的拍照效果。

在 DSP、配套 Codec 等方面,麒麟 970 也有所提升,其中配套的音頻 Codec 可以支持 32bit/384k 的音頻解碼,過去幾代華為高端機(Mate、P 系列)上表現乏善可陳的內放音質,有望在麒麟 970 這代產品上獲得明顯的提升,當然前提是 Mate 10 和 P11 系列還能保留 3.5 毫米耳機插孔。

另外,麒麟 970 依然搭載了 i7 協處理器(和牙膏廠的 i7 沒啥關係),而 inSE(integrated secure element)和 TEE 安全引擎,在麒麟 970 上也都在。

在匯流排架構上,不出意外的話,麒麟 970 採用的應該是和 960 相同的 CCI-550。

10 納米製程,比驍龍 835 還多的 55 億個晶體管

製程上,不出意外,麒麟 970 用上了台積電(TSMC)最新的 10 納米工藝,這應該是繼蘋果 A10X、聯發科 Helio X30 之後,第三款採用台積電 10 納米製程的移動 SoC。

通常來說,在晶元晶體管數量相同的情況下,更先進的製程可以降低晶元的核心面積,有助於降低成本,並且更加有效地控制發熱和功耗。根據華為提供的數據,台積電的 10 納米製程可以降低 20% 的能耗,將晶元核心面積縮小 40%。

不過有趣的是,麒麟 970 的核心面積並沒有因為製程的進步而縮小,反而比麒麟 960 還要略大,這是因為麒麟 970 集成了高達 55 億個晶體管,比麒麟 960 多出了 15 億。作為對比,蘋果的 A11 Bionic 晶元有 43 億個晶體管,高通驍龍 835 有 31 億個。

需要說明的是,雖然晶體管數量對性能有一定的影響,並且通常是越多越好,但在內部部件眾多的、各家產品架構甚至內部組件都不太一樣(比如 A11 Bionic 沒有集成通訊基帶和專門的 NPU)的移動 SoC 中,我們是無法簡單地用晶體管數量來判斷性能的。

NPU:首款內置在手機 SoC 中的人工智慧晶元

終於到了麒麟 970 最特別的部分——NPU。

NPU 的全稱是 Neural-network Processing Unit,也就是神經網路處理單元。關於這顆 NPU 的功能,大家可以簡單理解為專門高效地進行 AI 相關計算定製的處理器,就像 GPU 之於圖形處理相關的計算,ISP 之於成像相關的計算。

傳統的 CPU(包括 x86 和 ARM)和 GPU 也是可以用來做深度學習計算的,但由於它們本身並不是專門為深度學習定製的,效率並不高。而麒麟 970 的這顆 NPU 採用了來自寒武紀(Cambricon)的 IP,專門為深度學習而定製,FP16 性能達到了 1.92 TFLOP,差不多是麒麟 960 的 3 倍(0.6 TFLOP 左右)。

在月初德國柏林的發布會上,余承東展示了一張在進行 AI 運算時,NPU 和 CPU、GPU 的對比。

可以看到,性能上,NPU 是 CPU 的 25 倍,GPU 的 6.25 倍(25/4),能效比上,NPU 更是達到了 CPU 的 50 倍,GPU 的 6.25 倍(50/8)。

在這個 NPU 的基礎上,華為打造了 HiAI 移動計算架構,大致的原理是通過一個統一的資源管理器,充分調用 CPU、GPU、ISP、DSP、NPU 等部分,app 開發者可以通過使用這個架構,提高 app 中和 AI 相關的應用的處理效率(官方數據是 25 倍的性能,50 倍的能效優勢)。

在現場的演示中,華為展示了在進行照片識別時,麒麟 970 相比其他旗艦機具備明顯的優勢。

根據華為提供的數據,在包括 NPU 在內的 HiAI 架構的加持下,麒麟 970 每分鐘可以識別約 2000 張,iPhone 8 Plus 可以識別 889 張,iPhone 7 Plus 為 487 張,三星 Galaxy S8 只有 95 張(註:測試過程中,iPhone 應該是調用了 GPU,三星 S8 應該只是在用驍龍 835 的 CPU 在跑)。

除了單純在術層面的「秀肌肉」,發布會上,華為還展示了麒麟 970 的 AI 能力在日常生活中的實際應用,具體有下面幾個。

第一個功能叫做「慧眼」。麒麟 970 可以脫離網路限制,直接在本地對物體進行精確地識別,現場的展示中,華為把葡萄、蘋果等物體擺在搭載麒麟 970 的原型機之前,手機可以準確地完成識別,並根據識別結果計算出對應的卡路里。

第二個是 AI 降噪。大致的原理是通過深度學習演算法,從而更有效地過濾周圍環境的噪音。這個功能最適合的使用場景之一就是在車內等嘈雜的環境中進行語音喚醒,華為表示,搭載麒麟 970 的手機(應該就是 Mate 10 和 Mate 10 Pro 了)在車載場景下的語音識別率可以從 80% 提升到 92%。

第三個功能是 AI 美顏。這個功能和之前美圖在部分手機上的美顏技術類似,都是自動檢測人臉並根據機內演算法進行美顏,不過有了麒麟 970 相關的 AI 優化,可以把這個美顏過程做得更加快速和精確。

第四個功能是智能自動回復及情緒識別。麒麟 970 能夠對文本的內容進行提取,並根據文本內容智能地進行回復和提醒,比如說聊天中輸入文字「今天發工資了」,手機可以自動聯想出開心的表情,輸入「敦刻爾克」,手機可以自動推薦附近影院的觀影信息。類似的功能華為在榮耀 Magic 上就已經嘗試過,在麒麟 970 的硬體平台下,理論上可以做得更加快速和智能。

AI 加持的手機 SoC

對於喜歡折騰手機的用戶來說,手機 SoC 的性能可能永遠都沒有「過剩」的那一天,不過對於更多的「普通用戶」來說,隨著過去幾年裡 SoC 整體性能的不斷提升,新款 SoC 在性能上帶來的體驗加成正在變得越來越小。在 5G 時代到來之前,在移動 VR 和 AR 應用取得突破之前,這種情況很可能會一直持續下去。

在這個背景下,今年的各大晶元廠商紛紛把注意力投向了 AI。

除了額外增加一顆專門為 AI 相關運算定製的晶元(NPU)、讓手機本身具備更好的 AI 處理能力的華為海思,蘋果在 A11 Bionic(中文名為「A11 仿生」)上,也重點強調了「每秒運算次數最高可達 6000 億次的神經網路引擎」。在這之前,今年 5 月,ARM 在發布新一代 CPU 架構 Cortex-A75 和 A55 時,重點強調了提高 AI 運算能力的 DynamIQ 設計。今年 7 月,高通開放了自家的神經處理引擎(Neural Processing Engine,NPE)的 SDK,幫助開發者使用驍龍 SoC 進行 AI 相關的運算。在 AI 席捲整個科技圈的浪潮中,以麒麟 970 為代表的手機 SoC 在 AI 上的探索只是一個開始。

當然,相比起這些技術和概念,用戶更關心的可能是 AI 究竟能給智能手機體驗帶來多少變化,而對於麒麟 970 來說,我們需要等待的是即將在 10 月 16 日發布的華為 Mate 10 系列手機。

責任編輯:小猴子 sunny

原文鏈接 → 只為商業新變數


推薦閱讀:

小米6與華為p10相比,消費者會做出怎樣的選擇?
小米的預熱宣傳做得怎麼樣?和其他手機廠商相比有什麼優缺點?
年底入手全球首款AI手機華為Mate 10 Pro還是值得的
一將無能, 累死千軍;老闆無能, 將士用命

TAG:华为海思 | SoC | 华为 |