震撼柏林城!全球首款7nmAI晶元華為麒麟980正式發布

震撼柏林城!全球首款7nmAI晶元華為麒麟980正式發布

來自專欄 DeepTech深科技89 人贊了文章

華為終於在市場殷殷期盼之下,由華為消費者業務 CEO 余承東在柏林 IFA 會場上發布了全新一代的麒麟 980 AI 智能手機方案。

此次的麒麟 980 晶元強調可持續的高效能運作模式,在高性能表現的同時,也能兼顧長時間使用。

據華為介紹,作為最前沿的手機 SoC 晶元,麒麟 980 擁有全球首商用領先的 TSMC 7nm 製造工藝,工藝性能提升 20%,能效提升 40%,晶體管密度提升 1.6 倍,因此可以實現性能與能效的雙重提升。

(現場圖片來自:ANANDTECH)

麒麟 980 使用了全新設計的雙 ISP 架構,可以在更低的延遲之下達到更高的處理效率。

(現場圖片來自:ANANDTECH)

全新一代的 NPU 設計,在 AI 性能上遠超過現有其他強調 AI 的競爭產品。

據介紹,麒麟 980 採用全球首度商用的 Cortex-A76 架構CPU與 Mali-G76 GPU。搭載業內首款雙核 NPU,實現每分鐘圖像識別 4500 張,支持人臉識別、物體識別、物體檢測等 AI 場景。率先支持 LTE Cat.21,峰值下載速率 1.4Gbps。

(現場圖片來自:ANANDTECH)

隨著雙 NPU 的加入,視頻實時處理成為可能,而對物體識別的精確度也大幅提升。

(現場圖片來自:ANANDTECH)

雙 NPU 也能對視頻進行實時的多人動作捕捉能力。

(現場圖片來自:ANANDTECH)

相較前一代,AI 性能提升了 135%,能耗也改善了 88%。

(現場圖片來自:ANANDTECH)

4.5G 基帶,提供 4x4 MIMO 以及高達 5CC 的 CA 能力,可說是 5G 時代來臨前的最強基帶。

(現場圖片來自:ANANDTECH)

麒麟 980 也在過去比較弱的 Wi-Fi 連線能力上有極大的改進,最高傳輸速度達 1732Mbps。

(現場圖片來自:ANANDTECH)

華為也提供麒麟 980 加 Balong 5000 的准 5G 方案。

(現場圖片來自:ANANDTECH)

華為和 Amazon 合作,把 Alexa 內建至華為 AI Cube 之中。

(現場圖片來自:ANANDTECH)

作為旗艦方案,麒麟 980 搶先業界競爭者發布,有其指標性意義,去年麒麟 970 便是憑藉著領先全球業界發布的 AI 硬體功能,搶走了不少消費者的眼光。

然而,在經過這一年智能手機對人工智慧定義與硬體功能的演化,麒麟 980 面臨的競爭也明顯增加,恐無法像前一代的麒麟 970 般如入無人之境。畢竟經過一年時間準備,其他競爭者也摩拳擦掌準備進入市場,在 7nm 工藝,以及整合 AI 功能等一致訴求下,以各自的技術優勢與生態經營同台競技。

身為手機終端人工智慧領跑者的華為,除了擁有將近一年的領先優勢,麒麟 980 的推出,其真正的使命在於:不只要領先,更要持續領先。

AI 方案各家著眼點不同,華為訴求開放生態

手機上的終端 AI 應用於 2017 年由蘋果及華為帶起一波浪潮,二者幾乎同時在其主打方案,也就是 A11 Bionic 與麒麟 970 中引入了 NPU 硬體神經計算網路單元,大幅加速終端與邊緣 AI 計算落地時程。

同時期的其他方案供應商,多半只能通過軟體來模擬 AI 功能,這導致一來計算性能不足,使得 AI 場景在應用時明顯會感覺到遲滯,無法隨心所欲;二來,AI 計算包含了複雜的數學與邏輯計算,需要處理大量的數據,因此缺乏硬體設計的方案在功耗及發熱等層面的表現亦更為疲弱;最後,如果是以丟回雲端處理再回傳結果的作法,除了遲延性的問題,雲端存儲個人數據所建立的學習模型,又可能牽涉到個人數據隱私疑慮。也因此,諸如蘋果或華為的本地端 AI 方案也就成為手機 AI 發展主流。

以硬體 NPU 而言,A11Bionic 的神經網路專用加速模塊比較特殊,目前只用在了 Face ID 人臉解鎖上,沒有開放給第三方。而華為的 NPU 則是支持了標準 AI 框架,並且對第三方開發者開放,由此所衍生的整體生態效應非常具有想像空間,也可看出華為極力打造自有 AI 生態的強烈企圖心。

即將在 2018 下半年推出的新款手機方案中,硬體 AI 計算單元基本上已經是必備要件,這主要歸功於蘋果和華為帶動的潮流效應,而可以預期的是,蘋果與華為也必定會在此處持續加強,以延續先前的優勢。但聯發科等追隨者也不甘示弱,AI 計算單元成為其主流晶元方案中的標配功能。聯發科將採用與高通同樣的 GPU 與 DSP 混合計算,這種設計雖然彈性高,但能耗表現並不漂亮,而高通則傳言未來將全面走向硬體 AI 計算設計。

手機成為全能介面:他傻瓜你聰明背後隱藏龐大商機

為什麼要重視 AI 在手機上的發展?各家廠商或方案公司之所以爭先恐後要推出相關產品,主要就是因為手機是作為日常陪伴用戶時間最長的消費類電子產品,其上捆綁的應用已經成為用戶黏著性最高的商業介面,不論是遊戲,或者是智能語音服務,其對接的是龐大無比的商機,任何對此趨勢有基本認知的廠商都不會輕易放過這塊市場大餅。

也因此,如何讓消費者更自然而然的接觸、並依賴相關介面,就成為這些手機廠商努力的方向,而AI 就成為讓這些構想成真的啟動裝置。

這些所謂的 AI 功能,其目的之一就是為了帶給消費者更便利的日常生活,盡量用最少的程序就可以完成最大多數的工作步驟,很多關鍵問題的判斷就是交由 AI 來處理。換言之,通過 AI 輔助,麻煩瑣碎的工作都交由手機來代勞,使用者只要動動手,甚至連動手都不用,動口就好。

然而 AI 並不是先天就什麼都懂,它必須通過訓練才能獲得處理這些工作流程的「知識」,在主流的 AI 神經網路框架中,我們可以通過對龐大樣本的觀察與學習,訓練出可解決特定應用問題的模型。而這也是包含華為在內的各大手機廠商所努力的方向。

麒麟方案將作為華為全場景智能生活布局核心

華為從手機跨足各種網路產品,也深度布局未來 5G 應用。從今年華為全球合作夥伴及開發者大會上,余承東就闡述了華為的全新戰略即「全場景智能生活生態戰略」,包括手機、平板、PC、可穿戴、電視、音箱、車機、以及泛 IoT 的照明、安防、監控等,構建起汽車、家庭、辦公、運動健身等幾大主要場景。

華為真正目標想打造一個開放的 AI 生態平台。從設立諾亞方舟實驗室進行 AI 演算法的研究、管理 AI 的技術合作、識別 AI 主要應用場景和需求管理,還與高校開展合作。去年,華為推出 AI 手機晶元麒麟 970 由自己進行 AI 晶元設計,便是交由台積電製造、硅品封裝、京元電測試,今年的麒麟 980 也是延續這樣的合作模式。

華為有 5G 技術優勢,結合 AI 技術後,未來在智能家庭、車聯網、智能商店、工業 4.0 等等,全都要仰賴 5G 網路。而手機作為各類服務的主要介面,為了兼顧這些未來的應用方向,其核心架構自然也是要面向未來,在各方各面採用最先進技術是確保競爭優勢的最好方法。

華為自研架構是為確保生態優勢的必走方向

華為的自研之路其實已經走了非常久的時間,早在 2G 時代,華為就曾推出自有的基帶與手機晶元方案,然而從推出到堪用,足足花了五年的時間打磨。而華為逐漸掌握手機晶元設計的訣竅之後,也期望能夠從這方面取得市場競爭優勢,而不是只能作為目的是降低成本的跟風之作。

麒麟晶元整合 AI 計算單元帶給業界相當大的震撼,過去多數手機廠商雖然在其產品中導入了類似 AI 處理的輔助功能,但有沒有專用硬體處理,在執行效率上可以說天差地遠。

華為更搶在蘋果之前進行全球營銷戰,硬是把首款 AI 手機這個名號從蘋果的手中搶過來,讓華為在後續的產品行銷戰中一直處於強勢地位。

然而,麒麟方案的研發與推展,對華為而言是痛與快樂並陳,由於研發所投入的資金極為龐大,基本上很難回收,且過去很長一段時間麒麟晶元的採用與相關終端出貨規模其實也不足以支撐獲利,對華為手機部門而言,麒麟極為昂貴,甚至不下於高通的高端方案,因此早期華為採用麒麟晶元設計生產的終端比重並不高。

不過,隨著華為在渠道與產品定位和策略逐漸清晰,高端產品的銷售力道也越來越強,相關高端手機產品占華為出貨比重也逐漸增加,到了麒麟 970,甚至已經佔到華為季度出貨約 2 成。這是個相當大的比重,尤其華為基於高通、聯發科方案的中低端手機出貨量極大的情況之下,高達 20% 的比重已然是非常可觀的數字。

從麒麟 970 到麒麟 980,最新架構的引進大幅改進能效表現

麒麟 970 這款在 2017 下半年推出的晶元對華為而言極具有戰略意義,其推動的華為產品布局與 AI 應用生態,奪走了許多消費者的眼光,也順勢推動華為的許多產品的銷售。

然而,從麒麟 970 的設計理念中,還是能看出華為為了節省成本而做的努力。首先,其 CPU 架構採用 4 個Cortex-A73 搭配 4 個 Cortex-A53,是當時的主流高端架構,但是在 GPU 方面,卻只採用了 12 核心的Mali G72,並通過提升運行頻率以強化其性能表現。這種作法相當簡單粗暴,但是對於降低晶元面積以及 IP 授權成本有一定的效果,只不過還是有些副作用出現,首先,由於頻率較高,將直接挑戰架構和工藝本身的功耗牆,一旦超過邊界極限,那麼功耗和溫度就會直線上升,影響持續性能輸出表現和穩定性,手機也會明顯發熱。

為了控制成本,麒麟晶元通常會使用少核心高頻的手段來取得成本和效能的平衡,但功耗效能上的表現多少都會受到影響。為了解決這個問題,華為利用軟體優化手段,也就是 GPU-Turbo 手法,針對性的瞄準特定遊戲應用來優化其功耗與性能表現,的確發揮了不錯的效果,就連高通也希望仿效這種作法來改善其硬體的表現,對業界整體而言,華為的確帶起了一波技術革新與示範作用。

而麒麟 970 的另一個重點在於全球首發的 AI 硬體 NPU 設計,其AI算力很強,可以在 1W 功耗下達到4TOPS 的性能表現,不止相關應用的性能與效果超出高通的異構計算,甚至蘋果 NPU 也自嘆不如,而其他的「純軟體模擬 AI 方案」就更不用說了。

而此次在 IFA 大會上發布的麒麟980,採用的是 Cortex-A76。Cortex-A76 是在今年 6 月才發布,官標的數據方面,基於台積電 7nm 工藝的 3GHz A76 核心比 10nm 2.8GHz 的 A75 核心性能提升 35%、省電40%、機器學習的負載能力提升 4 倍。

在 GeekBench 4 跑分方面,整數和浮點相較於 A73 提升了 90% 和 150%,最終得分提升 35%。

A76 同樣支持 DynamIQ 拓撲特性,官方建議 1+7/2+6 這樣的 Big.little 大小核設計。通過使用最新核心,麒麟 980 的性能表現也達到驚人的程度,另外在 GPU 部分,同樣也採用了最新的 Mali-G76,其性能密度提升了 30%,節電 30%,用於手機的圖形性能會提高 50%,現在可以支持最高 8K 解析度的屏幕了。不過由於成本考慮,雖然核心數量只有 10 個,較麒麟 970 少了 2 個,但性能是相當於 20 箇舊版核心。

但值得注意的是,由於必須考慮到成本架構,華為在麒麟 980 的架構設計上依然還是偏重成本控制,所以除了使用最新架構外,核心數量或者是自定核心並沒有太過積極的動作,因此,在同業對手的方案相繼跟上 7nm 腳步後,華為要面對的競爭態勢也將會有所改變。

不過在重點的 AI 單元,華為將繼續使用專用 NPU 的方案,並使用了雙核配置,性能達前代方案的 135%。而且其設計原生為 7nm 工藝優化,更能適合麒麟 980 的設計方向,而這點也將成為麒麟 980 能否領導未來手機 AI 方案的重要關鍵。

其他 AI 手機方案競爭者

  • 即將引入硬體 NPU 的高通

作為全球最大的手機方案供應商,高通過去通過 Hexagon 與 GPU、CPU 協同工作,達成對主流AI 框架的計算加速能力,雖然在效率上還是明顯落後蘋果與華為的硬體方案,但總是給市場一個交代。

然而,異構計算(Heterogeneous computing)雖然彈性高,且可以有效利用晶元中的不同類型計算架構,但目前 AI 計算方案講求的是更高的能效表現,而在手機等移動終端上,更顯重要,雖然高通的異構計算已經屬於相當高效的技術,但仍與 ASIC 有一定的落差,也因此,在使用針對 AI 加速框架進行性能的評比應用時,高通很明顯要落後採用硬體 NPU 的競爭對手,未來如果 AI 模型往更複雜的方向發展,或者是同時需要執行多種 AI 服務,那麼在發展空間上就可能會明顯不如競爭對手了。

(來源:高通官網)

不過,高通也不是不知應變,根據市場傳聞,其在下一代中高端方案驍龍 700 系列中,將引入硬體 NPU 設計,而如果成真,其下一代高端方案,也就是驍龍 855,也將可能沿用同樣的方式。

而目前高通也引進了包含商湯等多家 AI 演算法設計公司所設計出來的應用框架,想要快速衝刺相關市場,不過高通目前的 AI 性能還有相當大的改善空間,如果要負載更複雜、多元的 AI 計算,恐怕還是要等到下一世代的 AI 設計問世。而根據 DT 君得到的信息,高通將在 12 月正式發布新一代的高端 AI 手機方案,按照往例,明年初就可以見到實際終端產品。

  • 三星從抄襲到走出自己的路,Exynos的半軟半硬 AI 亦然

三星作為全球最大的手機廠商,其勢力涵蓋終端、消費、雲端服務、半導體製造與設計等領域,而其中,手機市場是其最重視的一塊,而為了推動其手機市場的布局,三星過去亦步亦趨的追隨包含蘋果與高通的步伐,並將學習到的設計精髓轉化為自有的方案設計。

目前三星主要的晶元來源包含了自行設計的 Exynos 系列、高通的驍龍系列、聯發科的低端 MT 系列,以及展訊的 SC 系列,市場從最高端,到最低等級,可能會被我們直接當作電子垃圾的產品,幾乎都有覆蓋。

目前 Exynos 9810 是三星的主力自產高端產品,今年的 Galaxy S9 系列、Note9 系列都可見到其身影,其採用的 AI 計算方式與高通類似,主要是通過 DSP、GPU 與 CPU 的協同計算,不過三星有個特殊的作法,那就是視覺相關的處理交由硬體,而非異構計算。

目前的 9810 採用脫胎自 Cortex-A75 的 M3 定製架構,並搭配 Cortex-A55 作為小核心,而與華為最大的不同是,三星在 GPU 規模上相當捨得下工本,其 Mali-G72 核心數量配置高達 18 個,比麒麟 970 多出 6 個,雖然晶元成本會較高,但可以在較低的時鐘水頻達到更穩定、更好的效能表現,換言之,能效也更好。

(來源:三星官網)

而 9810 中有個 VPU 計算單元,顧名思義,是用來處理視覺方面的計算工作,這個單元應該是硬體設計,但只能用來處理比較固定的功能,三星也未公開發布任何支持該計算單元的可編程或開發套件框架。

而其他的 AI 計算工作就如高通般,是使用異構計算,統 GPU 與 CPU 來達成,這方面可能主要是沿用 Arm 的軟體資源,三星也同樣沒有發布任何相關的開發套件給第三方開發者。

而下一代方案,也就是 Exynos 9820,將會採用 ARM DynamIQ 架構設計,並且將以「2+2+4」三叢集形式打造,其中兩組大核將採用三星第四代自主架構「M4」,第二道兩組大核則以 ARM Cortex-A75 構成 (也可能以 Cortex-A76 取代),而小核部分則將以 4 組 ARM Cortex-A55 構成。

AI 部分則將可能維持 9810 的作法,那就是採用 VPU 硬體處理單元來處理部分視覺計算工作,並搭配既有的異構計算方式來處理標準 AI 計算框架,也就是半軟半硬的方式。

最後,9810 採用的是三星 10nm工藝,而 9820 將可能是三星 7nm 方案首發,但因為三星的 7nm 採用 EUV 技術,目前還在調試中,真正量產最快也要今年底或明年初,這也可能讓 9820 成為最晚推出的次世代 AI 手機晶元方案。

  • 賺走最多錢的手機公司搞 AI——蘋果

蘋果基本的手機晶元布局是每年一款,當然,為了配合如平板電腦或者是手錶等其他終端的產品時程,也會在不特定的時間點發布相關方案。而蘋果最新的手機晶元是去年發表的 A11 Bionic,內建的硬體 NPU 是最大特色。而蘋果在其晶元中往往都使用較少的核心,相較對手都已經走到 8 核以上,蘋果 A11 還只是個 6核產品,但其表現出來的性能數據卻遠遠超越所有競爭對手,其原因包括蘋果對其使用的 Arm 架構深度定製化,並捨得為了特定性能目的來堆加更多晶體管,因此其晶元製造成本往往也都比同時期的手機晶元方案更高。但此策略成功推動手機的銷售,並創造更高的獲利,因此每一代方案蘋果也就更捨得堆料,形成正向發展。

A11 使用的是台積電 10nm 工藝,這也是少數幾次沒有使用到三星代工工藝的蘋果晶元,由於目前蘋果的開發套件中,只開放 GPU 計算能力給開發者,而 GPU 也負擔包括第三方 AI 應用的訓練或推理的工作,對蘋果而言,GPU 的份量也越來越重要,這也是之所以蘋果要推動自有 GPU 架構的發展。

雖然目前所採用的 PowerVR 架構在性能與菜單現上相當出色,該公司也願意配合蘋果進行高度定製工作,但這對於蘋果而言仍遠遠不足,而展望未來蘋果對其 GPU 架構的布局,將可能是個結合繪圖、計算以及推理、訓練的全功能 AI 優化設計,當然,為了能耗表現,推理工作可能還是維持獨立的 NPU 單元來進行。

而未來 A12 將會如何?其實在現階段也只能猜測,唯一能確定的只有使用 7nm 製造工藝這點。而在架構方面,根據過去的慣例,性能的增長肯定是不能忽略的,畢竟對手也都在積極追趕,今年對手的主流方案都已經在整體性能上有相當大的改善,也拉近了與 A11 的距離,A12 肯定會在CPU 與 GPU 方面進行更深度的改造,不論是增加更多的處理管線,更優化 CPU 或 GPU 內部的流水線設計,亦或者粗暴的堆加核心,都是可能的作法。

至於在關鍵的 AI 硬體單元方面,除了強化效率以外,也可能就規模方面進行擴展,藉以壓制華為或高通等即將面世的下一代 AI 方案。

  • 專註中低端的聯發科

聯發科 2018 年主打的 AI 手機方案 P60,具備 AI 專用計算模塊的APU(AI specialized Processing Unit),基於 DSP 計算架構,而 CPU 則是採用Cortex-A73 搭配 Cortex-A53 的四大四小設計,雖然不是採用最新的 Cortex-A76,但性能表現仍有一定水準,GPU 方案則是使用 Mali-G72 這款相當穩定的 GPU 架構,不過可惜的是,聯發科為了成本考慮,只採用 MP3 配置,並以高頻率運作來補足性能表現,因此在運行遊戲時,可能會對電池壽命產生負面影響。目前 P60 已經被應用在包含 OPPO 等多款手機產品當中,雖後的小改版產品也已經箭在弦上。

(來源:聯發科官網)

目前,中國前幾大手機廠商都是聯發科的客戶,產品多分布在中低端,包含華為、OPPO、VIVO、小米、魅族,以及其他二三線廠商,基本上都擺脫不了聯發科,畢竟中低端手機中具備成本優勢,產品線完整且技術更新還能跟上市場腳步,且能提供最好技術支持服務的,就屬聯發科了。而在前兩年,聯發科也打入三星的供應煉,通過使用一定比重的三星晶元代工工藝服務,三星也在其低端手機中採用聯發科的方案作為交換。

聯發科的方案成本相對較低,且過去在包裹 TurnKey 服務方面口碑極好,在中國的支持人力也最廣泛,雖然是 AI 生態的後進者,但是在商湯等 AI 大公司的協助之下,或許第一時間就能夠提出夠成熟的語音與視覺 AI 方案,對客戶而言,聯發科一直都是便宜又大碗的選擇。


推薦閱讀:

全形拓,一種古樸而莊嚴的「黑科技」
浮想聯翩!42張高科技產品廣告設計欣賞
python os模塊總結
美高M3微型投影儀為什麼上市成手持主流機型
GPS小知識課堂,第5點必須知曉

TAG:科技 | 晶元集成電路 |