華為麒麟980手機晶元細節曝光?一文談盡全球手機AI方案戰局

華為麒麟980手機晶元細節曝光?一文談盡全球手機AI方案戰局

來自專欄 DeepTech深科技108 人贊了文章

華為即將在 8 月底 IFA 大會上發布新一代麒麟 980,其相關參數已經有部分泄漏至網路媒體上,雖然還有些問題,但據傳已經相當接近最終規格

圖|網上流出的麒麟 980 參數

當然,作為旗艦方案,如麒麟 980 在 8 月底搶先業界競爭者發布,有其指標性意義,去年麒麟 970 依靠領先全球發布的 AI 硬體功能,搶走了不少消費者的眼光。不過在經過這一年智能手機對人工智慧定義與硬體功能的演化,麒麟 980 面臨的競爭也明顯增加,無法像其前輩麒麟 970 般如入無人之境,畢竟競爭者也將站上同一起跑點,在 7nm 工藝,以及整合 AI 功能等一致訴求下,以各自的技術優勢同台競技

AI 方案各家著眼點不同,中低端的布局也同樣重要

手機上的終端 AI 應用於 2017 年由蘋果及華為帶起一波浪潮,二者幾乎同時在其主打方案,也就是 A11 Bionic 與麒麟 970 中引入了 NPU 硬體神經計算網路單元,大幅加速終端與邊緣 AI 計算落地時程

圖|華為麒麟970晶元(圖源:華為)

同時期的其他方案供應商,多半只能通過軟體來模擬 AI 功能,這導致一來計算性能不足,使得 AI 場景在應用時明顯會感覺到遲滯,無法隨心所欲;二來,AI 計算包含了複雜的數學與邏輯計算,需要處理大量的數據,因此缺乏硬體設計的方案在功耗及發熱等層面的表現亦更為疲弱;最後,如果是以丟回雲端處理再回傳結果的作法,除了延遲問題,雲端存儲個人的學習模型又有隱私泄漏疑慮,也因此,像蘋果或華為之類的本地端 AI 方案也就成為手機 AI 發展主流。

以硬體 NPU 而言,A11 Bionic 的神經網路專用加速模塊比較特殊,目前只用在了 Face ID 人臉解鎖上,沒有開放給第三方。而華為基於寒武紀的 NPU 則是支持了標準 AI 框架,並且對第三方開發者開放,這也可以看出華為極力打造自有 AI 生態的野心

圖 | 蘋果的NPU主要用在FaceID功能上,並沒有對外開放(圖源:蘋果)

即將在 2018 下半年推出的新款手機方案中,硬體 AI 計算單元基本上已經是必備要件,蘋果和華為可以說引領手機 AI 潮流,也必定會在此處持續加強,但聯發科等追隨者也不甘示弱,AI 計算單元成為其主流晶元方案中的標配功能,但聯發科將採用與高通同樣走 GPU 與 DSP 混合計算,這種設計雖然彈性高但能耗表現並不漂亮而高通則傳言未來將全面走向硬體 AI 計算設計,因此,聯發科在手機 AI 市場能否打出漂亮成績,亦或可能出師不利,仍值得觀察。

圖|蘋果 A11 手機晶元(圖源:蘋果)

雖然我們習慣把眼光重點擺在最新最強大的架構上,也就是即將面世的 7nm 手機方案,但對整體移動產業而言,真正的重頭戲應該是在 10nm、12nm 甚至 16/14nm 等成熟工藝推動的中低端手機 AI 方案,這些方案的推出,代表手機 AI 生態即將全民化,往後不具備 AI 功能的手機就如過去的功能機一般,將會被主流市場淘汰。

他傻瓜你聰明的背後隱藏商機

為什麼要重視 AI 在手機上的發展?各家廠商或方案公司之所以爭先恐後要推出相關產品,主要就是因為手機是作為日常陪伴用戶時間最長的消費類電子產品其上捆綁的應用已經成為用戶黏著性最高的商業介面,不論是遊戲,或者是智能語音服務,其對接的是龐大無比的商機,任何對此趨勢有基本認知的廠商都不會輕易放過這塊市場大餅。

也因此,如何讓消費者更自然而然的接觸、並依賴相關介面,就是這些手機廠商努力的方向,而 AI 就成為讓這些構想成真的啟動裝置

這些所謂的 AI 功能,其目的之一就是為了帶給消費者更便利的日常生活,盡量用最少的程序就可以完成最大多數的工作步驟,很多關鍵問題的判斷就是交由 AI 來處理。換言之,通過 AI 輔助,麻煩瑣碎的工作都交由手機來代勞,使用者只要動動手,甚至連動手都不用,動口就好。

圖|對自然語言的理解也是未來手機AI的重點發展方向(圖源:蘋果)

然而 AI 並不是先天就什麼都懂,它必須通過訓練才能獲得處理這些工作流程的「知識」,在主流的 AI 神經網路框架中,我們可以通過對龐大樣本的觀察與學習,訓練出可解決特定應用問題的模型

而以下就是兩大類主要的 AI 應用

數字自我的驗證與延伸

系統(這邊的情境主要是具備 AI 功能的手機)可以通過學習,來判斷使用者的身份,包括臉部識別、虹膜識別或指紋識別等,通過這些手段,系統確認使用者的身份後,就可以接入背後的龐大系統

比如說手機可以記錄你全天的生活,並且分析出使用者所處的場景,通過各類感測器的定位與互動,以及與 IoT 網路的結合,能在正確的時間點和正確的設備進行互動,讓使用者的心思可以全部放在工作或學習中,不需分心處理其他任務。

而整個系統生態的布建,包含軟體與硬體設備和相關資源的推動,就成為隱含龐大利益的商機。

情緒、語言與視覺理解能力:

配備了 AI 能力的手機,可以依照使用者的日常說話語調或用詞,判斷出使用者的正確意圖,而語音助手的引入,讓用戶不必手動輸入,僅通過簡單的語音指令就能實現手機喚醒、調動應用程序或進行信息查詢等多種操作。而語音助手也能視為另一種門戶,可以將用戶引導至各種商業服務介面,實現更智能的商業服務工作。

在主流語音助手方面,如蘋果的語音助手 Siri,三星的語音助手 Bixby,華為的語音助手小 E,熄屏喚醒、自定義喚醒詞、翻譯,設鬧鐘、刷微博、導航打車購物等多項任務,小米方面也剛將小愛同學接入到手機產品上。

圖|作為語音助手的挑戰者,Bixby主打更聰明的語言理解能力(圖源:三星)

語音助手的引入給用戶帶來了更多貼心服務的同時,也能一定程度降低智能機用戶的使用門檻。而自然語言理解能力除了可作為語音助手理解使用者命令的核心技術外,亦可作為萬能翻譯機,使用者只要有一支手機配合足夠優秀的離線翻譯模型,理論上就能無障礙走遍全球

另外,視覺理解能力可以應用在地點識別、物體識別、人臉識別、照相場景匹配等功能上,甚至配合未來的 AR 外設,達成科幻影片中虛實合一的境地。

2018下半年各家 AI 手機市場與方案布局

不論自用,或者是對外銷售,目前一線手機方案廠商大多已經開始用上台積電的最新工藝,也就是 7nm,而根據目前得知的產品時程,華為將於八月底發布,時間最早,而蘋果則是緊追在華為後面,而高通也因為轉用時程較早的台積電 7nm 工藝,而非過去一直合作的三星,因此在產品時程上也有可能提早到今年發表,提供客戶採用,而非像過去要等到隔年第一季。

但放棄高端方案,轉而回歸中低端性價比訴求的聯發科,就沒有跟上 7nm 的腳步,而是使用代工價格較為合理的 12nm 工藝來打造其 2018 年新 AI 方案

而以下 DT 君就從各家供應商的市場競爭來為讀者解說目前的狀況,而評價的內容主要還是以各自 AI 的生態布局為主。

  • 為確保生態優勢推動掛 Turbo 的自研 AI 架構—華為

華為的自研之路其實已經走了非常久的時間,早在 2G 時代,華為就曾推出自有的基帶與手機晶元方案,然而從推出到堪用,足足花了五年的時間打磨。而華為逐漸掌握手機晶元設計的訣竅之後,也期望能夠從這方面取得市場競爭優勢,而不是只能作為目的是降低成本的跟風之作

麒麟晶元整合寒武紀 AI 計算單元帶給業界相當大的震撼,過去多數手機廠商雖然在其產品中導入了類似 AI 處理的輔助功能,但有沒有專用硬體處理在執行效率上可以說天差地遠

圖|華為在麒麟 970 中使用寒武紀提供的 NPU,為其帶來極大的 AI 性能優勢,即將發布的麒麟 980 不出意外也將使用寒武紀的最新 AI 加速架構(圖源:華為)

華為更搶在蘋果之前進行全球行銷戰,硬是把首款 AI 手機這個名號從蘋果的手中搶奪過來,讓華為在後續的產品行銷戰中一直處於強勢地位

不過麒麟方案的研發與推展,對華為而言是痛與快樂並陳,由於研發所投入的資金極為龐大,基本上很難回收,且過去很長一段時間麒麟晶元的採用與相關終端出貨規模其實也不足以支撐獲利,對華為手機部門而言,麒麟極為昂貴,甚至不下於高通的高端方案,因此早期採用麒麟晶元的終端比重都相當小

當然,到了麒麟 960、970,相關終端占華為出貨比重也逐漸增加,到了麒麟 970,甚至已經佔到華為季度出貨約 2 成。這是個相當大的比重,尤其華為基於高通、聯發科方案的中低端手機出貨量極大的情況之下,高達 20% 的比重已然是非常可觀的數字

主力手機 AI 方案:麒麟 970 這款在 2017 下半年推出的晶元對華為而言極具有戰略意義,其推動的華為產品布局與 AI 應用生態,奪走了許多消費者的眼光,也順勢推動華為的許多產品的銷售。

圖| 2017 年發布的麒麟970至今仍是華為許多高端手機的核心(圖源:華為)

然而,從麒麟 970 的設計理念中,還是能看出華為為了節省成本而做的努力。首先,其 CPU 架構採用 4 個 Cortex-A73 搭配 4 個 Cortex-A53,是當時的主流高端架構,但是在 GPU 方面,卻只採用了 12 核心的 Mali G72,並通過提升運行頻率來提升其性能表現。這種作法相當簡單粗暴,但是對於降低晶元面積以及 IP 授權成本有一定的效果,只不過還是有些副作用出現,首先,由於頻率較高,很容易突破架構和工藝本身的功耗牆,一旦突破,那麼功耗和溫度將直線上升,影響持續性能輸出表現和穩定性,手機也會明顯發熱

當然,後來華為利用軟體優化手段,也就是 GPU-Turbo 手法,針對性的瞄準特定遊戲應用來優化其功耗與性能表現,當然,華為宣稱其是從 Android 系統底層進行的徹底優化,但以簡單的邏輯來推論,若是系統層的優化,何以不能直接套用到所有遊戲軟體中,而必須個別優化?

當然,DT 君這次不討論其具體優化手段為何,但這個優化作法,對其行銷的確發揮了不錯的效果,甚至高通也希望仿效這種作法來改善及硬體的表現,對業界整體而言,華為的確帶起了一波技術革新與示範作用,不論其背後包裝的真相如何。

而麒麟 970 的另一個重點在於全球首發的 AI 硬體 NPU 設計其來自中國 AI 晶元大廠寒武紀的架構,可以在 1W 功耗下達到 4TOPS 的性能表現,不止相關應用的性能與效果超出高通的異構計算,甚至蘋果的 NPU 也要自嘆不如,而其他的「純軟體模擬 AI 方案」就更不用說了。

圖|寒武紀新款的1M終端智能晶元將可能成為下一代麒麟晶元的 AI 核心(圖源:寒武紀)

展望未來的麒麟 980 架構,其可能採用的是 Cortex-A75,畢竟 Cortex-A76 是在今年 6 月才發布,即便華為是 A 級客戶,能提早市場至少一季接觸新架構,但應該還是來不及,當因為華為的授權形式,可能會在 Cortex-A75 的基礎上進行一定的改善。而 GPU 方面也可能還是維持採用 Mali-G72,但核心數量可能擴大一倍以上,藉此與麒麟 970 拉開距離,不要落後市場主流太多。

而重點的 AI 單元,華為將繼續使用來自寒武紀的方案,其最新的方案相較上一代的寒武紀-1A 在效率上有著相當一定程度的改進,而且其設計原生為 7nm 工藝優化,更能適合麒麟 980 的設計方向。

優勢:華為方案可以說與自家的所有生態緊緊捆綁,並相互輝映,由於華為同時已是全球最大移動網路基站設備供應商要針對自家基站來優化手機晶元的無線技術自然具有相對優勢,畢竟技術細節只有自己最了解,這點甚至要比高通更有優勢。

另外,由於麒麟晶元已經成為華為推動移動生態的核心示範架構,為了確保競爭優勢,華為肯定也會願意投入更多的成本來確保其技術特定能夠領先對手,或至少不要落後。

劣勢成本問題一直是麒麟晶元的最大軟肋,研發一款規模如此龐大,且牽扯生態又極為複雜的晶元方案,所投入的資本可以算得上是天價,而這些成本對華為而言其實回收難度相當高,未來投入 7nm 工藝的麒麟 980,成本恐怕又將進一步拉高又。不過,幸好華為還有獲利豐厚的其他事業可以支撐其手機布局,因此短期間之內麒麟晶元的生態仍會持續壯大,仍有機會以時間換取空間,進一步發掘出更多獲利模式

另一方面要考慮的不利因素,則來自於國際市場的不確定性,除了電信網路設備外,終端出貨是否也可能受到牽連影響,將是值得觀察的重點。而也必須考慮到的是,華為的 AI 生態很大一部份都是針對國內的商業雲端服務而來,無法照樣搬移至國外市場,這與蘋果、高通這種真正從研發之初就針對國際市場的企業相較之下,還是顯得較為遜色。

另外,雖然華為在高端方案下了重本,推出可能是目前最強大的 AI 方案,但是在中端方案,比如說新近推出的麒麟 700 系列,卻把這個特色拿掉,相較起注重 AI 性能的高通驍龍 700 系列,以及直接主打 AI 應用的聯發科 P60,華為在中端方案的規劃可能顯得就不夠周延,使得採用該方案的終端產品可能會明顯缺乏競爭力

  • 借 AI 產業龍頭之力打入手機 AI 生態的後進者—聯發科

聯發科在遭遇客戶轉向,市場明顯萎縮的情況下,毅然決然放棄高端計算方案,轉而回頭經營擅長的中低端高性價比產品,在面對市場的需求下,也同樣加入 AI 計算單元,但與蘋果、華為不同的是,聯發科選擇採用 DSP 架構,並與商湯、曠視等 AI 方案夥伴合作,推出包含視覺、自然語言、人臉解鎖、物體檢測等高端 AI 應用,以過去其擅長的 TurnKey 概念來串起 AI 生態,客戶只需要完成硬體設計,在 AI 環境方面只需要花費最少的功夫就能建構完成

主力手機 AI 方案: 聯發科 2018 年主打的 AI 手機方案 P60,具備 AI 專用計算模塊的 APU(AI specialized Processing Unit),基於 DSP 計算架構而 CPU 則是採用 Cortex-A73 搭配 Cortex-A53 的四大四小設計,雖然不是採用最新的 Cortex-A76,但性能表現仍有一定水準,GPU 方案則是使用 Mali-G72 這款相當穩定的 GPU 架構,不過可惜的是,聯發科為了成本考量,只採用 MP3 配置,並以高頻率運作來補足性能表現,因此在運行遊戲時,可能會對電池壽命產生負面影響。目前 P60 已經被應用在包含 OPPO 等多款手機產品當中。

圖|聯發科P60主打高性價比,並同時兼顧AI計算與應用性能(圖源:聯發科)

客戶:目前中國前幾大手機廠商都是聯發科的客戶,產品多分布在中低端,包含華為、OPPO、VIVO、小米、魅族,以及其他二三線廠商,基本上都擺脫不了聯發科,畢竟中低端手機中具備成本優勢,產品線完整且技術更新還能跟上市場腳步,且能提供最好技術支持服務的,就屬聯發科了。而在前兩年,聯發科也打入三星的供應鏈,通過使用一定比重的三星晶元代工工藝服務,三星也在其低端手機中採用聯發科的方案作為交換。

圖|包含OPPO、vivo、華為、小米等中國一線手機大廠都是聯發科的客戶(圖源:OPPO)

優勢:聯發科的方案成本相對較低,且過去在包裹 TurnKey 服務方面口碑極好,在中國的支持人力也最廣泛,雖然是 AI 生態的後進者,但是在商湯等 AI 大公司的協助之下,或許第一時間就能夠提出夠成熟的語音與視覺 AI 方案,對客戶而言,聯發科一直都是便宜又大碗的選擇

劣勢:聯發科通常為了成本考量,比較不捨得在晶元中堆料,換言之,其通常都採用一些特殊方式來達到節省成本的目的,比如說用比較少核數的 GPU但拉到比較高的頻率,藉此來達到成本與性能兼顧但實際上往往都會產生其他如功耗控制或者是性能表現不穩定的問題。而在其 AI 方案中,由於採用 DSP 作為 AI 加速架構,在性能或者是功耗表現上不如華為或蘋果等競爭對手,而因為成本考量,可能也沒辦法與同樣使用 DSP 架構的中端高通方案相提並論。

  • 以異構計算打入 AI 領域的手機方案龍頭—高通

作為全球最大的手機方案供應商,高通過去通過 Hexagon 與 GPU、CPU 協同工作,達成對主流 AI 框架的計算加速能力,雖然在效率上還是明顯落後蘋果與華為的硬體方案,但總是給市場一個交代。

然而,異構計算 (Heterogeneous computing) 雖然彈性高,且可以有效利用晶元中的不同類型計算架構,但目前手機等移動終端上 AI 計算方案講求的是更高的能效表現,雖然高通的異構計算已經屬於相當高效的技術,但仍與 ASIC 有一定的落差,也因此,在使用針對 AI 加速框架進行性能的評比應用時,高通很明顯要落後採用硬體 NPU 的競爭對手,未來如果 AI 模型往更複雜的方向發展,或者是同時需要執行多種 AI 服務,那麼在發展空間上就可能會明顯不如競爭對手了。

圖|高通驍龍方案一直以來是各家手機廠商高端方案的唯一選擇(圖源:高通)

不過,高通也不是不知應變,根據市場傳聞,其在下一代中高端方案驍龍 700 系列中,將引入硬體 NPU 設計,而如果成真,其下一代高端方案,也就是驍龍 855,也將可能沿用同樣的方式。

主力手機 AI 方案目前高通的 AI 方案普遍以中高端方案為主,包含驍龍 600 系列、700 系列以及 800 系列,600 系列是比較古早的架構,包含 CPU、GPU 及 AI 性能方面也最弱,工藝則是使用 28nm。700 系列則是 2018 年才推出的新分類,主要沿用從舊款高端方案下放的規格,並且改以 10nm 生產,而未來小改款的 700 系列,根據市場信息指出,有可能會將原先的異構軟體 AI 加速設計,改而使用硬體混合軟體的形式,藉此取得和蘋果、華為、三星等可以一較高下的實力。

圖| 高通的 AI 方案採用異構計算方式,彈性高,但能效稍低,未來可能轉用ASIC硬體計算(圖源:高通)

高通在 AI 生態方面,從過去只開放給客戶,也開始轉而開放給第三方開發者,這些措施包括提供驍龍神經處理引擎(NPE,Neural Processing Engine)的軟體開發包 SDK,隨後也推出包含軟硬體兩部分的 AI 引擎(AI Engine),在驍龍核心架構上搭載了神經處理引擎(Neural Processing Engine,NPE)、Android NN API、Hexagon 神經網路庫等軟體,這對其相關生態的成熟有一定的幫助

圖| 高通的 NEP 開發環境支持主要的AI框架,並可在高通方案上得到相當不錯的執行效果(圖源:高通)

而目前高通也引進了包含商湯等多家 AI 演算法設計公司所設計出來的應用框架,想要快速衝刺相關市場,不過高通目前的 AI 性能還有相當大的改善空間,如果要負載更複雜、多元的 AI 計算,恐怕還是要等到下一世代的 AI 設計問世。

客戶做為全球公認的無線技術領先者,基本上採用高通的方案就確保了進入國際市場的基本門票。也因此,全球除了蘋果以外,幾乎都是高通的客戶。即便是擁有麒麟晶元的華為,也都還是有相當大比例的產品使用高通的方案。

優勢:高通不只在基帶擁有世界一流的技術,在 CPU 與 GPU 方面的設計能力也是舉世有目共睹,以移動 GPU 架構而言,甚至可和 NVIDIA 分庭抗禮,且不落於下風,而以高通在全球市場的布局,客戶要進入全球市場,基本上就只能選擇高通方案。

劣勢雖然高通佔據全球手機晶元市場最大份額全球有接近一半的智能手機晶元出自高通,但目前高通在 AI 生態方面並沒有太多優勢,且因為使用的是異構計算,在調用系統資源或者是決定負責計算工作的單元時,效率表現上可能比較差,雖然高通在最新款的驍龍晶元中強化了 AI 計算性能,但根據根據蘇黎世聯邦理工學院的研究人員開發的 AI Benchmark 應用測試,高通的 AI 性能表現和華為的硬體方案仍有相當可觀的差距。這對未來 AI 應用的複雜化與普及化有著負面的影響,高通需在現有框架上整合硬體 AI 計算單元才有機會改善

  • 賺走最多錢的手機公司搞 AI—蘋果

蘋果以單一企業囊括整體手機產業的絕大部分利潤,近來其市值更是超過一萬億美元,已經超過全球許多國家的產值,這樣的企業投入 AI 生態的發展,卻是令人意外的保守

由於蘋果是美國企業,對於個人隱私有著較高的要求,因此強調不把個人數據用於雲端建立自己的模型,並積極進入終端 AI 技術的發展。在其自用的晶元方案中引入硬體 AI 處理單元 NPU,蘋果雖然已經開放 AI 開發套件給第三方開發者,但主要能取用的計算資源還是在 GPU 加速部分,硬體 NPU 其實還沒有完全開放給開發者

蘋果對於使用者數據的使用極為小心,這也是造成其語音助理 Siri 之所以在聰明程度上逐漸落後於主流對手的原因之一,不過蘋果並沒有放棄 Siri,而是希望通過更好的機器學習演算法,希望即便不使用涉及隱私的大眾數據,也要能做到從聲音表現,到後端服務的整合都做到更開放、聰明的程度。

圖|蘋果在WWDC大會上發布一系列機器學習方案,要推動手機上的AI應用(圖源:蘋果)

而蘋果在今年 WWDC 上發布的 Core ML 與 Create ML,增加了更多元的框架支持以及應用場景,同時也希望降低由第三方開發者部署自訂 AI 模型到手機應用上的難度,讓開發者在其生態中能夠更得心應手的取用各種計算資源,改善 AI 軟體的體驗。

主力手機 AI 方案:蘋果基本的手機晶元布局是每年一款,當然,為了配合如平板電腦或者是手錶等其他終端的產品時程,也會在不特定的時間點發布相關方案。而蘋果最新的手機晶元是去年發表的 A11 Bionic,內建的硬體 NPU 是最大特色。而蘋果在其晶元中往往都使用較少的核心,相較對手都已經走到 8 核以上,蘋果 A11 還只是個 4 核產品,但其表現出來的性能數據卻遠遠超越所有競爭對手其原因包括蘋果對其使用的 Arm 架構深度定製化,並捨得為了特定性能目的來堆加更多晶體管,因此其晶元製造成本往往也都比同時期的手機晶元方案更高。但此策略成功推動手機的銷售,並創造更高的獲利,因此每一代方案蘋果也就更捨得堆料,形成正向發展。

A11 使用的是台積電 10nm 工藝,這也是少數幾次沒有使用到三星代工工藝的蘋果晶元,由於目前蘋果的開發套件中,只開放 GPU 計算能力給開發者,而 GPU 也負擔包括第三方 AI 應用的訓練或推理的工作,對蘋果而言,GPU 的份量也越來越重要,這也是之所以蘋果要推動自有 GPU 架構的發展。

雖然目前所採用的 PowerVR 架構在性能與功能表現上相當出色,該公司也願意配合蘋果進行高度定製工作,但這對於蘋果而言仍遠遠不足,而展望未來蘋果對其 GPU 架構的布局,將可能是個結合繪圖、計算以及推理的全功能 AI 優化設計,當然,為了能耗表現,推理工作可能還是維持獨立的 NPU 單元來進行。

而未來 A12 將會如何?其實在現階段也只能猜測,但根據過去的慣例,性能的增長肯定是不能忽略的,畢竟對手也都在積極追趕,今年對手的主流方案都已經在整體性能上有相當大的改善,也拉近了與 A11 的距離,A12 肯定會在 CPU 與 GPU 方面進行更深度的改造,不論是增加更多的處理管線,更優化 CPU 或 GPU 內部的流水線設計,亦或者粗暴的堆加核心,都是可能的作法

至於在關鍵的 AI 硬體單元方面,除了強化效率以外,也可能就規模方面進行擴展,藉以壓制華為或高通等即將面世的下一代 AI 方案。

優勢:作為全球最有錢的手機公司,蘋果在前後端甚至晶元本身所能負擔的成本遠不是其他相似企業所能比較的,好比華為,同為自研方案,但華為在成本方面的控管其實非常明顯,畢竟以手機產品本身而言,蘋果真的能賺錢,但華為其實還賺不了錢。

其次,蘋果聚集了全球最聰明的人才與最優秀的商業模式,App Store 更是讓開發者賺最多錢的 APP 商店,不論在生態或技術,蘋果都有能力持續發展與茁壯。

劣勢目前蘋果手機產品的出貨增長已經陷入停頓,而因為其產品的高價化,未來也很難有成長的空間,而我們知道,終端的數量其實與生態的發展息息相關,當然,蘋果也有可能推出更多採用其 AI 技術的各類型終端來擴增其生態,但難度很高。

另一方面,蘋果與高通的專利爭議,對蘋果而言也是芒刺在背,由於高通一旦退讓,就等於是否定自己的營收模式,因此肯定會和蘋果懟到底,對蘋果而言,目前的營收成長有一部份是來自於其對高通專利費用的拒交,加上若高通如果贏了官司,未來這兩年蘋果通過售價的拉抬而增加的獲利,恐怕就會被吃掉一大部分。

  • 從抄襲到走出自己的路,半軟半硬的 AI 亦然—三星

三星作為全球最大的手機廠商,其勢力涵蓋終端、消費、雲端服務、半導體製造與設計等領域,而其中,手機市場是其最重視的一塊,而為了推動其手機市場的布局,三星過去亦步亦趨的追隨包含蘋果與高通的步伐,並將學習到的設計精髓轉化為自有的方案設計

目前三星主要的晶元來源包含了自行設計的 Exynos 系列、高通的驍龍系列、聯發科的低端 MT 系列,以及展訊的 SC 系列,市場從最高端,到最低等級,甚至是可能會被我們直接當作電子垃圾的產品,幾乎都有覆蓋。

當然,Exynos 與高通方案主要肩負了三星中高端市場的任務,過去其 AI 方案也都圍繞著這兩大方案發展,而基本上,高通過去提供怎樣的 AI 應用,三星就會複製一套過去用在 Exynos 平台上,當然,高通是很保護自己的 IP 的,三星通常得另闢蹊徑,務求在不同平台上能呈現出一樣的功能,且效能落差不要太明顯。畢竟三星的高端產品中,很多是同一型號但使用了不同的晶元方案,如果使用體驗落差太大,那麼就很難說服消費者。

圖| 三星的Exynos一直以來都是和高通的方案對標,但是在AI功能上搶先引進硬體化的圖像處理單元(圖源:高通、三星)

Exynos 架構的發展非常早,其前身其實是三星早期供應給蘋果的晶元逐漸轉化而來,關於這一點,可能很多人會以為看錯了,但這是早期一段快要被遺忘的發展歷史,早期蘋果手機的晶元是直接採用三星所設計的方案,後來蘋果也開始參與晶元的設計過程,並給了一些建議,而三星也就毫不客氣的將二者合作的成果直接套用到自家手機上。

後來蘋果不想再被三星耍著玩,轉而自行設計晶元方案,雖然還是在三星的代工廠投產,但三星不敢再抄,如果這種情況下還敢抄,一來晶元代工廠的生意往後也不需要做了,二來,來自蘋果的天價求償恐怕很難僥倖躲過。此後三星只好以過去和蘋果合作的基礎,逐漸發展自有的設計,當然,三星早期自行設計方案,除了降低成本,一來也是要磨練代工廠業務,畢竟半導體工藝技術良率都是從實際操作中粹煉出來的沒有捷徑可言

目前 Exynos 的設計也走向與高通類似的方向,那就是核心架構的高度定製化,並且搭配異構的計算架構,提供包含日常應用或者是 AI 應用所需要的計算性能。

主力手機 AI 方案:目前 Exynos 9810 是三星的主力高端產品,今年的 Galaxy S9 系列、Note9 系列都可見到其身影,其採用的 AI 計算方式與高通類似,主要是通過 DSP、GPU 與 CPU 的協同計算,不過三星有個特殊的作法,那就是視覺相關的處理交由硬體而非異構計算

目前的 9810 採用脫胎自 Cortex-A75 的 M3 定製架構,並搭配 Cortex-A55 作為小核心,而與華為最大的不同是,三星在 GPU 規模上相當捨得下工本,其 Mali-G72 核心數量配置高達 18 個,比麒麟 970 多出 6 個,雖然晶元成本會較高,但可以在較低的時鐘水頻達到更穩定、更好的效能表現,換言之,能效也更好。

而 9810 中有個 VPU 計算單元,顧名思義,是用來處理視覺方面的計算工作,這個單元應該是硬體設計,但只能用來處理比較固定的功能,三星也未公開發布任何支持該計算單元的可編程或開發套件框架。

而其他的 AI 計算工作就如高通般,是使用異構計算,統 GPU 與 CPU 來達成,這方面可能主要是沿用 Arm 的軟體資源,三星也同樣沒有發布任何相關的開發套件給第三方開發者

而下一代方案,也就是 Exynos 9820,將會採用 ARM DynamIQ 架構設計,並且將以「2+2+4」三叢集形式打造,其中兩組大核將採用三星第四代自主架構「M4」,第二道兩組大核則以 ARM Cortex-A75 構成 (也可能以 Cortex-A76 取代),而小核部分則將以 4 組 ARM Cortex-A55 構成。

圖|9820除了自行定製的M4核心以外,還將可能使用Arm最新的Cortex-A76核心(圖源:Arm)

AI 部分則將可能維持 9810 的作法,那就是採用 VPU 硬體處理單元來處理部分視覺計算工作,並搭配既有的異構計算方式來處理標準 AI 計算框架,也就是半軟半硬的方式。

最後,9810 採用的是三星 10nm 工藝,而 9820 將可能是三星 7nm 方案首發,但因為三星的 7nm 採用 EUV 技術,目前還在調試中,真正量產最快也要今年底或明年初,這也可能讓 9820 成為最晚推出的次世代 AI 手機晶元方案。

優勢三星自有的 Exynos 方案在多年發展之後已經越來越具備一線高端方案的水準,除了基本的性能表現以外,基帶技術也基本達到華為、英特爾的技術水平,之所以沒有以之全面取代高通的方案,主要是還有作為與高通的合作籌碼之用,高通願意在三星的晶元代工廠下單,有部分也是害怕三星手機產品全面採用自有 Exynos 方案,畢竟三星也是高通高端方案的最大客戶,如果不配合,掉單也是很有可能的事情。

而除了作為商業策略的武器之外,Exynos 的技術發展還是相當到位,也逐漸走向如高通般高度定製的道路,甚至也曾傳出三星將會自行打造 GPU 架構的信息。

作為三星的親兒子,就如麒麟之於華為,Exynos 的發展也是非常重要,在同質化越來越高的市場中,要能夠達到差異化,自有方案的發展已經是不可或缺的手段

劣勢:在 AI 布局方面,目前三星走的是封閉道路,不像高通、華為或蘋果般提供第三方開發者相關的開發套件,也不見其在主流 AI 框架的支持上有什麼明顯的動作,相較華為的積極布局,並爭取第三方開發者的支持,三星在這方面明顯不怎麼用心,不過三星自身也有許多關於 AI 方案的關係企業,並進行了不少相關移植工作的推動,所以當全球都走向開放環境,只有三星堅持自己的道路,逆潮流而行。但畢竟使用者關注的還是體驗,若三星能提供足夠優秀的體驗,那麼開不開放可能就無所謂。

但即便三星如何家大業大,畢竟以一家之力,要覆蓋各種類 AI 應用其實還是力有未逮,因此,將全球第三方開發者都排除在外並不是聰明的作法,或許三星之後會有新的市場布局和作法。


推薦閱讀:

TAG:手機晶元 | 華為 | 華為手機 |