AI晶元市場最強預判:華為蘋果高通為何數億美元豪賭7nm?
來自專欄機器之能33 人贊了文章
主流核心玩家比任何時候都渴望「爆款」的出現,以刺激閾值不斷提升的消費者神經。從去年後半段開始風靡的「AI 手機」當之無愧成為「爆款」的熱門關鍵詞。人們期待 AI 拓寬手機終端的邊界,一如當年智能機對功能機的顛覆。然而,如果 AI 手機的角逐只停留在參數對比和跑分排位,那麼競爭遠未觸達本質。
撰文 | 四月
一面是市場銷量增長乏力,一面是巨頭對手步步緊逼,手機業競爭的殘酷指數再度升級。
金九銀十,手機市場亦是如此。在不到半個月的時間裡,華為 Mate20、蘋果 iPhone X 二代兩款全球最強旗艦機即將揭開最後面紗,安卓陣營里的其他玩家 OPPO、小米、聯想也在積極準備亮出更強底牌。
手機戰場正酣時,來自 IDC 的全球手機市場報告卻釋放出不容樂觀的信號:智能手機行業增速在過去一年遭遇了史無前例的滑鐵盧,並且主要來自於中國智能手機市場的乏力。
主流核心玩家比任何時候都渴望「爆款」的出現,以刺激閾值不斷提升的消費者神經。而從去年後半段開始風靡的「AI 手機」當之無愧成為「爆款」的熱門關鍵詞。人們期待 AI 拓寬手機終端的邊界,一如當年智能機對功能機的顛覆。
自一年前的麒麟 970 問世以來,「全球首款 AI 晶元」的標籤無疑為國產芯打上了一針強心劑。自 2000 元不到的榮耀 10 到 5000 元以上的華為 P20 Pro,麒麟 970 幾乎把華為的所有機型都加持了一個遍。緊隨其後發布的是蘋果內置有神經網路加速模塊的 A11 Bionic 仿生處理器,Face ID、Animoji 等創新應用讓 iPhone X 驚艷四座。
而今年初高通開放的人工智慧引擎 AI Engine 則讓驍龍 845 在異構基礎上實現了 CPU、GPU、DSP 等眾多硬體模塊的協同處理,讓安卓玩家在終端側就能夠實現演算法優化和 AI 應用。
內置AI晶元開始成為打造一款AI手機的必要條件。
可以預見的是,在即將開打的2018新機換購大戰中,圍繞高通、蘋果、華為三大晶元巨頭展開,以及三星、谷歌、聯發科等選手積极參与的「AI芯」戰場必將升級為要塞之地,頭號玩家非驍龍855、麒麟980和蘋果A12處理器莫屬。
繼去年的10nm工普及藝之後,摩爾定律快速進入到7nm世代。三大巨頭不惜巨資押注台積電最新7nm工藝,背後是對於晶元AI化計算趨勢的篤定,同時也為三家公司率先拿下了新一輪「AI芯」戰場的入場券。
但同一水平線的起跑賽道並不代表著技術實力的追平,高通、蘋果、華為三家公司在手機晶元領域的能力排位仍需全面分析。
作為全球第一大移動晶元供應商,高通佔據著四成以上的 SoC(系統晶元)市場份額,以遠高於競爭對手的市場地位佔據絕對優勢。從過往的市場表現來看,安卓准旗艦晶元驍龍855在年底發布後將統治全球智能 SoC 榜單大半年。
而與高通主要供貨於安卓玩家不同,蘋果A系列與華為海思晶元主要用於自產自用,憑藉兩家公司全球 Top3 的手機出貨量帶動其晶元出貨。
低調的蘋果雖然很少拿自家的處理器性能作為賣點,但一如蘋果產品本身,每次A系列處理器的實際表現都能輕鬆凌駕於整個安卓陣營,即將出貨的A12也不會例外。
過去一年,華為海思用麒麟 970 優秀的參數跑分向市場證明,高通和蘋果在手機處理器領域並非不可戰勝,但在過於激進的降庫存戰略已經引發部分「花粉」(華為用戶)不滿。這樣的背景下,麒麟 980 承擔著背水一戰的民族使命,在產品周期已經領先的基礎上,以求追平甚至超越同期對手晶元,摘下名副其實的安卓旗艦桂冠。
然而,如果AI手機的角逐只停留在參數對比和跑分排位,那麼競爭遠未觸達本質。
從智能手機到人工智慧手機的更新換代,市場的最大訴求點和期待究竟是什麼? NPU 的打磨只為現有文字處理、語義理解、圖片識別等功能的加速?特別開闢的神經網路加速器僅為 Face ID 等原生應用而建?
直面爭議與質疑,別讓AI手機僅止步於概念。
3億美元入場券
手機處理器形態千萬,卻也逃不開IP壟斷戶ARM的影響。一款處理器的CPU性能強弱,除了和自主研發的架構相關,最重要的影響因素就來自於ARM的CPU核心。
實際上,ARM正是新一代7nm工藝背後最為有力的推動者。
今年6月,ARM發布了新一代移動處理器Cortex A76架構,使用7nm工藝製造,頻率可達3GHz。和前代的A75相比,Cortex A76性能提升了35%,功效提高了40%。更為重要的是,Cortex A7能夠提供高於現有機器學習的4倍性能,這恰恰也是蘋果、華為、高通、聯發科等一眾手機晶元廠商翹首以盼的增長點。
據市場預測,目前開發10nm晶元的成本超過1.7億美元,而7nm則達到了3億美元,5nm更是高達5億美元,3nm直接將超過15億美元。隨著工藝成本的大幅提升,僅高昂的入場券門票就足以甩開中低段位選手,在手機IC領域如今也只有華為、高通、蘋果等敢於投入跟進這場豪賭。
相比三星的激進策略,穩紮穩打的台積電似乎更受手機廠商青睞,今年來自蘋果、華為、高通的7nm訂單全都押注在了台積電產線上,今年初正式投產預計明年將引入EUV光刻工藝。
按照台積電CEO魏哲家的說法,到2018年底將有超過50個產品完成7nm設計定案(Tape out)。其中,AI晶元、GPU和礦機晶元佔了大部分的產能,其次是5G和應用處理器(AP)。與10nm工藝相比,台積電的7nm工藝密度提升為1.6倍。台積電聲稱其7nm工藝將性能提高20%,功耗降低40%。
電子創新網創始人張國斌評價道,不同於10nm僅用於移動處理器,7nm工藝將適用於各類處理器,所以7nm將是半導體工藝上的一個極其重要的工藝節點。可以預見的是,圍繞這個節點EDA公司和IP將開發大量產品,7nm工藝將或類似於28nm工藝節點,將維持一段較長的生命周期。
此外,隨著集成電路工藝要求的提升,針對晶元接點引腳和電路板連接的封裝工藝也更為先進。
根據台積電公布的7nm工藝資料來看,台積電為7nm工藝開發了系統級封裝技術SiP,它被認為是5G高速連接時代的重要封裝技術,或將為後續的7nm手機引入5G功能提供預留便利。
晶元戰略需要長期投入,在流片之前,長期的設計投入與驗證布局更能體現手機和IC 廠商的前瞻性。
華為子公司海思半導體進軍手機處理器至今已經5年有餘,從最開始泥沙俱下的K3V2到去年廣受好評的麒麟960,在風風雨雨中已經迭代了6代產品。有報道指出,在總共1萬人的海思團隊中,有3000人在做手機晶元。
自推出手機處理器以來,華為一直堅持在自家高端產品使用自家海思的處理器,雖然前期飽受非議,但在幾乎所有的國產手機廠商都受制於高通或聯發科的當下,尤其在「中興事件」之後,華為在晶元自研技術道路的堅持獲得了更多人支持。
與華為一樣,晶元是蘋果最重要,也是最為神秘的部門。
從2010年發布iPhone 4開始,蘋果就採用了自主設計的A4處理器。蘋果的晶元研發歷程最早可以追溯到2007年。據首席財務官盧卡·馬斯特里稱,蘋果每年數以十億美元計的資金投入中,大部分都花在研發各種諸如晶元、感測器的基礎技術上。
巨頭很早就意識到,自研晶元能夠讓其將儘可能多的技術和生產流程掌握在自己的手裡,從而實現對供應鏈的完全控制,讓更多的創新技術變得難以複製。
在解決了設計研發、量產工藝等難題之後,晶元廠商摩拳擦掌為上市準備。然而,產線供貨能力吃緊卻成為三大巨頭需要共同面對的當務之急。
就在上個月,台積電工廠遭到病毒攻擊,並導致數條生產線被迫中斷,而其中7nm製程的生產基地就被列入受影響的範圍之中。對於即將開售的iPhone X二代及其A12 晶元,以及搭載麒麟980的華為Mate 20是否會受到產線停擺的影響仍是個未知數。
最強賽場
ARM和台積電為三大晶元巨頭建立了牢固的先發優勢,但核心的晶元架構設計才是各家形成差異化競爭格局的核心。
麒麟980將繼續採用主晶元+NPU專用模塊的設計。核心架構層面, CPU為ARM最新的四大核A76和四小核 A55,最高主頻 2.8GHz,基帶由Cat.18升級到 Cat.19。
專用AI 硬體處理單元層面,華為將繼續沿用寒武紀IP核,預計將會是今年5月推出的第三代終端IP產品Cambricon 1M。
該NPU同樣採用台積電7nm工藝生產,提供2Tops、4Tops、8Tops三種規模的處理器核,並支持多核互聯,其8位運算效能比達5 Tops/W(每瓦5萬億次運算),性能比前任麒麟970採用的寒武紀1A高10倍。
值得注意的是,此前多份報告稱華為麒麟980將採用ARM Cortex A77 CPU多核心,但隨後遭到ARM官方的否認,麒麟980配備的是Cortex A76,雖然A 77性能更高但尚未公布。
而關於麒麟980將搭載華為新一代的自研GPU的傳言也不攻自破。根據最近外媒關於麒麟980的參數信息,麒麟980將繼續採用ARM提供的GPU Mail系列Mail-G72 MP24。相比麒麟970採用的Mail-G72 MP12系列,麒麟980的GPU核數提升到24核心,增加一倍。
今年蘋果的A12晶元暫未被曝出大的升級處理。
此前曾多次準確爆料的移動處理器博主i冰宇宙表示,蘋果A12可能沿用A11架構,處理器跑GeekBench 4單核成績是5200分,而多核性能是13000分上下,相較於A 11跑分成績,性能提升約25%,足以秒殺同期晶元。
目前,蘋果正在解決功耗問題,7nm情況下平均功耗依然比預期高出23%。外媒評論稱,蘋果將重新設計功能的iOS12,此舉有望降低對A12處理器的殺傷力。
值得注意的是,去年蘋果發布的A11處理器只能稱為仿生晶元,今年A12處理器定然將會在AI功能上大有改進,以達到真正的AI晶元級別。
對於高通而言,相比去年僅有SDK實現異構計算性能的提升,今年最大的驚喜將是引入NPU內核。這與去年麒麟970搭載的NPU類似將用於提升AI性能。
作為單純的上游晶元供應商,高通在高性能之外,還需要考慮應用場景和工藝成本等要素,在AI晶元方案上相對華為和蘋果更為保守也情有可原。
今年高通引入NPU之後,也預示著在人工智慧大潮下,AI晶元的設計方向最終歸一於獨立AI模塊的設計思路,多硬體單元組合式的異構計算單從SDK層面優化難免力不從心。
而在主流AI晶元玩家之外,三星、聯發科,以及谷歌等選手也在積極試探市場。
今年3月,聯發科的首款AI晶元Helio P60在國內亮相,與高通驍龍845一樣沒有獨立AI處理單元,其設計初衷是通過多顆DSP的能力來提升圖像後處理的運行效率,順便可以做些AI相關的圖像處理演算法。
該晶元能夠稱得上現在市面上能夠買到的最為實惠的一款AI晶元,出貨量表現不錯,同時為聯發科第二季度財報贏來了超預期表現。
同樣在3月,三星發布了型號為Exynos 9610 的新一代處理器,採用專用AI 硬體單元,三星稱之為Vision Image Processing Unit(可翻譯為視覺圖像處理單元),可以算作是三星真正意義上的一款智能手機AI 晶元。
而早在去年10月,谷歌在Pixel 2系列智能手機就隱藏了一個秘密武器,即谷歌自己研發的第一款移動晶元,它被稱為Pixel Visual Core,它是谷歌針對消費類產品的首款定製片上系統(SOC),目前專門用於加速相機的HDR+計算,使圖像處理更加流暢和快速。
但目前該晶元還處於「休眠狀態」。谷歌方面表示,在更新 Android Camera API 之後,以允許第三方攝像頭開發人員使用 HDR +和 Pixel Visual Core,它們將成為 Android Oreo 8.1 預覽中的開發人員選項。
內行看門道
實際性能並不等於峰值參數,還需要取決於軟硬體協同優化效果。這一道理在華為麒麟與蘋果A系列的對比中尤為明顯。
去年,華為曾用植入了寒武紀A1的NPU在性能參數上碾壓A11。比如,A11 Bionic內置的神經網路引擎浮點性能僅為0.6T(即能以每秒最高6000億次速度處理機器學習任務),而麒麟970NPU的浮點性能達到1.9T,是A 11的三倍還多。
但是別忘了,蘋果是最懂得軟硬體結合的手機廠商,在浮點性能不及對手的劣勢下卻將能夠最大化利用。早在iPhone X發布之前,蘋果在去年年中的WWDC開發者大會上就已經推出Metal和Core ML兩個不同層面的介面供開發者調用,以加速iOS平台上的人工智慧應用。
蘋果曾提到A11專門為Metal 2 和Core ML設計。有半導體業內人士猜測,A11可能對DSP進行調整,在軟體層面針對CPU和GPU加速的硬軟體結合實現的「神經網路引擎」。
參考海外知名處理器性能跑分工具,同時也是公信力最高的GeekBench 4實測結果。麒麟970(BLA-L29的Mate 10 Pro)的GeekBench 4跑分單核是2000分左右,多核6200分左右,而驍龍845的GeekBench 4單核在2500左右、多核在8500分左右。作為對比,A11單核和多核分別在4245和10100左右。
在主核CPU之外,影響終端性能表現,尤其是圖像、影像等數據處理效率的核心還是GPU性能。相比高通,華為和蘋果的AI晶元此前的短板之一都體現在GPU層面。
高通的 Adreno GPU 一直都是業界標杆,據說「虐殺」一眾競爭對手的 Adreno 630(驍龍 845)還只是高通 Adreno 家族的中端低功耗產品,真正殺手級別的 GPU 是強化版的 Adreno 640 和堪比 PC 顯卡的 Adreno 680。
不過按照高通一貫的新品節奏,驍龍 855 究竟採用哪款 GPU 可能到今年底才會正式揭曉。
曾有早期評論提到,麒麟970的能耗比是完全被驍龍835吊打的,甚至還不如驍龍820/821,三星Exynos 8890/8895,實際使用遠遠無法達到國內跑分測試數據。
麒麟970的Mali-G72 MP12在跑分上確實超越了Adreno 540,但是也僅限於跑分了,麒麟970的GPU跑分完全是不計功耗的跑分強行超越了驍龍835。按照這個趨勢下去,如果麒麟980繼續採用Mali系列的GPU,仍然遠不如驍龍845,更不用提追平下一代架構提升的驍龍855了。
此前,一加劉作虎曾談到「麒麟處理器要想超過驍龍處理器,十年之後再說。」而華為余承東最近給麒麟980貼上的預熱口號則是「麒麟980遙遙領先驍龍845和蘋果處理器」。
華為的底氣何在?
本月初,華為針對GPU性能提速的殺手鐧得以問世。這是來自華為2012實驗室的兩項新技術:THE NINE液冷散熱技術和和雙Turbo技術(CPU Turbo+GPU Turbo)。
先於今年6月問世的GPU Turbo已經打通華為EMUI操作系統和GPU、CPU之間的處理瓶頸,官方數據顯示,使得圖像處理提升60%,能耗降低30%。
而CPU Turbo基於THE NINE液冷散熱技術,將晶元產生的熱量快速均勻分布到機身其他部位並迅速散發出去。據介紹,整體散熱性能提升41%,在激發CPU的極限性能的同時使CPU最高可降低10℃。
而蘋果方面同樣沒有讓人失望。從GeekBench 4的GPU測試分數來看,A12分數是21691,而A11的表現只有16091,提升至少在30%以上。作為即將承擔大量AR應用的蘋果在A12而言,GPU的優化將是工作重點。
就現階段的幾款AI晶元整體表現來看,作為輔助工具的AI專用晶元模塊仍然只能扮演錦上添花的作用,重頭戲仍然由GPU性能決定。
不敢掉隊
那為什麼還要使用專用硬體解決方案呢?
國際知名媒體Android Authority曾提到這樣一個觀點:在桌面級晶元領域,獨立的FPU(浮點運算單元)晶元的出之後,極大的提高了桌面處理器的浮點運算能力,打開了處理器新世界大門。對於現如今移動晶元領域而言,亦是如此。
今年5月,中國電信發布的《AI終端白皮書》支持了這一看法。白皮書將AI手機定義為基於專用AI 單元或通用硬體單元(CPU、GPU、DSP)綜合調度提供AI算力,並載入深度學習AI應用的全網通手機。
趨勢之下,玩家不敢輕易掉隊。然而在過去一年的試水期里,市場似乎並不樂意買單。
追蹤旭日大數據公布的2018年三、四月份的全球手機晶元出貨量數據,排名前五的仍是針對中低端市場的晶元,其中聯發科的「首款AI晶元」P60以703萬片衝進四月榜單中的第二名。
而華為的麒麟970最好成績來自於四月榜單中的第8位,出貨量達到410萬。與此同時,高通的高端處理器高通驍龍845晶元排名第16位,出貨量168萬片。但結合華為自身強推麒麟970的去庫存戰略和高通地位而言,數據表現並不能算得上理想。
一般來說,一款處理器有其自身中高低端的定位;如果口碑極佳,那可能被很多廠商反覆使用,例如驍龍625、驍龍660,並不常見。比如,高通驍龍845是目前高端手機的御用晶元,搭載這款晶元比較火的手機有小米mix 2S、一加6、堅果R1等手機。
但是華為和榮耀就比較尷尬了,從1999元到9999元的手機都用麒麟970。這通常是庫存處理器過多無法及時消化的表現,在某種程度上也引發了消費者們的吐槽。
對於高通845出貨量較低,業界普遍觀點則認為,一是搭載這款晶元的手機價錢都比較高,性價比較低,二是高通馬上要推出新款855處理器,而845處理器無論是價錢還是實用性都處於一個比較尷尬的位置,所以導致這款晶元的出貨量遠遠低於高通4系列和6系列的處理器。
實際上,手機處理器在一款手機的BOM清單中一直佔有不小的比例。
今年三月,小米創始人雷軍就在個人微博稱:「驍龍 845,最新旗艦,非常出色,只有一個缺點:太貴了!!!驍龍 845,再加上 17% 的進口增值稅,500 多元!是驍龍 660 的三倍多!」
不得不承認,集成NPU短期內將會大幅增加處理器的成本,而能夠支付起該成本的只能是通過應用生態帶來的市場需求。
從參數上看,麒麟 970 性能著實強悍,然而在華為手機上並未完全釋放其卓越的性能,就其當下應用來看似乎有些「浪費」,
華為為 NPU 挖掘的功能包括「AI 慧眼識物」、「AI 精準虛化」、「隨行翻譯」等。華為選擇與微軟翻譯、百度等合作,通過 AI 晶元,加速文本、語音、照片的翻譯速度,提升用戶體驗。
然而,到目前為止,華為對於麒麟970 NPU的打磨也仍然停留在文字、語音、圖片識別階段,僅僅把這顆AI晶元作為輔助性工具,尚未有深層次的開發應用。
與麒麟970類似,iPhone X搭載的A11目前可見的作用可以在拍照、AR、Face ID方面體現。不過,蘋果的神經網路加速模塊也只對原生應用進行支持。
早在WWDC 2017開發者大會上,蘋果先於iPhone X就宣布了一系列新的面向開發者的機器學習API,包括面部識別的視覺API、自然語言處理API,這些API 集成了蘋果所謂的Core ML 框架。
從上圖可以看到,Core ML的底層是兩個神經網路子程序框架:Accelerate and BNNS和Metal Performance Shaders。Accelerate是在CPU上進行快速計算的框架,而Metal負責深度挖掘GPU性能。
據不便透露公司名稱的巨頭IC半導體資深工程師向機器之心表示,蘋果實際上主要將數據處理加速工作集中在GPU層面。
著名投資人 Benedict Evans 曾提到,「往深了看,很多機器學習技術正在被商業化,它們的 API 快速地進入到移動設備上……不可能只有一個 Google 或一個 Facebook 的雲包攬所有的機器學習——這項技術應該是一切的基礎。」
從英偉達在人工智慧浪潮中得以快速崛起的案例中不難發現,生態積累是比技術更持久的「護城河」,而開放易用的CUDA介面則是建立開發者生態的前提。為了迅速做大開發者規模,手機巨頭平台開始在初期釋放超高分成與合作資源。
2018年初,華為發布了AI開發平台HiKey 970,推動AI應用生態搭建,並將投入10億元用於鼓勵開發者創新。6月,余承東在華為終端首屆開發者大會上就宣布,將投入10億元補貼主力開發者的創新智慧服務。蘋果則在不遺餘力地擴建Core ML 中的API。
市場還在嗷嗷待哺地等待著一個 AI「爆款」。
推薦閱讀:
※台積電遭「病毒入侵」!蘋果、海思、比特大陸7納米晶元或受影響
※美國下注15億美元重點搞晶元,電子復興計劃首批入圍項目曝光
※沙子變金子全過程--CPU成長記
※AI晶元新救星?FPGA真這麼神嗎
※Hot Chips 30,黃金時代的縮影