從高通Centriq晶元看ARM伺服器生態 | 半導體行業觀察

來源:本文由半導體行業觀察翻譯自nextplatform ,作者Paul Teich謝謝。

高通在幾周之前發布了 Centriq 伺服器片上系統(SoC)。那場活動的中心是 Centriq 的技術規格和定價,並且還揭示了該生態系統的大量合作夥伴和客戶。我曾經介紹了三星用於 Centriq 的工藝並且該公司還在到處向其客戶推薦 Centriq,參閱:forbes.com/sites/tirias

儘管高通當時是在發布自己的 Centriq 2400 處理器,而並不是重點關注那些會使用該參考設計(reference design)的硬體合作夥伴,但高通還是選擇將其 Centriq 發布會的重點放在了生態系統的發展上,其中高通還著重強調了軟體工作負載和合作夥伴關係。因為當今很多的雲負載組合都基於運行時環境(即使用容器、解釋型語言等),所以比起操作系統和編譯器,發布一款新晶元更需要的是生態系統支持。

我們相信高通在高價值工作負載和應用上重點關注生態系統的戰略是健全合理的。Centriq 2400 發布會展示了很多 64 位 ARM 數據中心工作負載——我們從未看過這麼多工作負載集中在同一個地方。

實際上在高通的 Centriq 發布會上還是有很多硬體。在該發布會上給出的所有演示都是由基於高通 Centriq 參考設計的現場伺服器或基於雲的伺服器(基本託管在 Packet.net 上)所驅動的。本文將重點關注對高通在其發布會上和之後一周舉辦的 SC17 全球超級計算大會上提到的系統、軟體和解決方案所準備的技術。

高通的 Anand Chandrasekher 展示 Centriq 2400 晶圓和封裝

參考主板和平台讓系統生態系統成為可能

高通的 Centriq 參考主板設計是一種半寬主板,可以放進各種 1U 機箱中。該主板參考設計還符合開放計算項目(OCP)的 Project Olympus 的規格,該規格來自微軟 Azure。

高通的參考平台也可以將參考主板放進一個全寬機箱中,這樣合作夥伴和客戶就可以評估雙主板配置以及存儲豐富的配置。

我們看到有多個版本的高通參考平台,但僅有一個獨特的第三方設計。

高通 Centriq 參考平台前面板

在發布會上配置成存儲伺服器的高通 Centriq 參考平台

在 SC17 上配置為雙節點計算所配置的高通 Centriq 參考平台

另外,Open19 基金會的總裁兼董事會主席 Yuval Bachar 也選擇在高通的 Centriq 發布會上展示我們已經公開看過的其第一款 Open19 機箱。我們確實也在 SC17 上看到了另一種相競爭的 Open19 計算機箱,但那是沒太多人關注的 ODM 設計。可以想見未來幾個月還會有更多設計出現。

在發布會上帶有高通 Centriq 2400 主板的 Open19 演示機箱

Centriq 最重要的一個方面看起來很平淡無奇:Centriq 2400 的閑置功耗為 8W,峰值功耗為 120W,不需要液冷來實現高計算密度。我們在發布會和 SC17 上都看到了生產型的風冷 Centriq 2400 散熱器。

高通 Centriq 參考設計,左圖為帶有風冷散熱片的,右圖為不帶的

帶有風冷散熱片的高通 Centriq 2400 的特寫

高通在三月份的 OCP 峰會上展示過其參考主板的 Rev B(B 版本)。我們在發布會上看到了 Rev C 主板,然後高通在 ARM 的 SC17 展位上展出了一塊 Rev E 主板。電路板設計師忘記將下面照片中的文本改成 Rev C,但其主板編號表明它確實是 Rev C。

主板版本可以表明實現生產可行的系統的進展。注意這些主板的顏色變化:從 Rev B 和 C 的紅色變成了 Rev E 的藍色。這種顏色變化表明客戶可以評估乃至也許可以部署 Rev E 了。

高通 Centriq 參考主板版本

該參考平台包含一個靈活的電源分配板,我們在其上找到了幾個在發布會和 SC17 上提到的 Centriq 參考設計。

高通 Centriq 參考電源分配板

實現插件生態系統的插卡

高通設計的 Centriq 參考平台支持兼容 OCP Olympus 的插卡擴展。插卡擴展讓兼容 OCP Olympus 的高通 Centriq 主板在 1U 機箱的配置中能有很多選擇。

這種 1U 高度的 PCI-Express x16 插槽支持範圍廣泛的 PCI-Express 附加[add-in 翻譯為 附加。附加卡,附加板]卡,支持 1U 機箱中的多種實際配置。其它三種 Project Olympus 主板規格中沒有任何一種定義了 Centriq 2400 規格那樣多的插卡類型。

OCP 通用主板插卡(來自:高通)

高通當前的 Centriq OCP Project Olympus 通用主板規格定義了 6 種插卡類型:

1.在主板上方連接單個 PCI-Express x16 電子和機械附加卡,其中帶有主要元件的一面朝上,遠離主板。

2.在主板上方連接單個 PCI-Express x8 電子和機械附加卡,其中帶有主要元件的一面朝上,遠離主板,並且通過其 PCI-Express x8 連接器還在該插卡的背面增加了一個 M.2 插槽。

3.在主板上方將單個 PCI-Express x8 電子附加卡與 x16 機械附加卡連接到一起,其中帶有主要元件的一面朝上,遠離主板。在該插卡上第 2 種類型中 M.2 插槽的位置有一個 x8 OcuLink 線連接頭,可以在機箱內通過線纜擴展 PCI-Express。

4.將兩個 PCI-Express x8 電子附加卡與 x16 機械附加卡連接到一起,該插卡兩面各有一個,都面朝上,遠離主板。

5.連接單個 PCI-Express x16 電子和機械附加卡,遠離主板,其中帶有主要元件的一面朝下,從而最大化機箱底部和附加板之間的空氣量。這種插卡是專為增加高通的 「MegaCard」 NVM-Express 夾層而設計的。這款插卡包含一個 PCI-Express x1 控制線,連接到了 MegaCard 上的 PCI-Express 開關晶元。

6.連接單個 PCI-Express x16 電子和機械附加卡,遠離主板,其中帶有主要元件的一面朝下,留下最大化的機箱空間,可以在 Centriq 主板旁邊放入一個全尺寸、全功率(300 W)的 GPU 或 FPGA 加速板卡。

在過去幾周中展示的第 1 類插卡和電源分配板都是 Rev B 評估型的原型設計。

在發布會和 SC17 上展示了兩種類型的附加卡:Mellanox 網路附加卡(上面和下面的多個系統中都有)和高通的 MegaCard。

帶有 OCP 第 1 類 PCI-Express 插卡(紅色)的高通 Centriq 2400 主板,其中一個插卡上帶有一個網卡(右邊帶有黑色散熱片的卡),這是在 SC17 上看到的

高通的 MegaCard 支持 20 個 M.2 NVM-Express 存儲卡,在 MegaCard 每一面各 10 個。NVM-Express 卡連接著一個MicroSemi PM8536 PCI-Express 3.0 轉換器。這個轉換器通過上面提到的 PCI-Express x16 第 5 類插卡連接到高通 Centriq 主板上。因為 10 個 M.2 卡需要一定的主板面積,所以 MageCard 會在全寬 1U 機箱中佔據另一個 Centriq 2400 主板的位置;PCI-Express 連接頭在第 1 類型插卡的另一面,並且安裝在該插卡上更高的位置。高端 NVM-Express 硬碟有 4TB 容量,所以高通的 MegaCard 可以支持 80TB 的 PCI-Express 3.0 NVM-Express 存儲。

高通MegaCard 特寫(上圖),安裝在參考設計機箱中的樣子(下圖)(來自:高通)

插卡讓高通 Centriq OCP 系統客戶可以使用種類繁多的第三方附加板。附加板擴展將能讓基於 Centriq 的系統實現計算、存儲和網路擴展功能,還能將負載遷移到加速器上。

在 Centriq 發布會上,高通強調了應用和工作負載的重要性。高通及其合作夥伴在發布會上為此設置了二十幾個展示台。

高通的目標是能夠很好擴展的高度線程化的工作負載。對於搜索、內容交付網路和內存密集型的數據分析等容器化的、基於微服務的應用而言,高通的高線程數和高內存帶寬的架構是非常適用的。

高通 Centriq 發布會上的展示

兩家資料庫公司展示了運行在高通 Centriq 2400 上的性能擴展數據:MariaDB 和 ScyllaDB。

MariaDB 是一個開源的 SQL(關係)聯機事務處理(OLTP)資料庫。Centriq 2400 的高核心數讓 MariaDB 每個連接模型的一個線程可以很好地擴展;MariaDB 的內部測試表明:在一個 48 核的 Centriq 2400 處理器上,可以近乎線性地擴展成 46 個並發的資料庫會話。剩下的幾個核心專用於管理任務(housekeeping tasks)。

MariaDB 演示截屏(來自:MariaDB)

每個 MariaDB 會話在每個核心上都實現了每秒平均 10 000 次查詢,使得每個 Centriq 2400 伺服器節點每秒可實現多達 420 000 次查詢。由於每個核心只有一點開銷,所以管理任務可以分散出去,並且單個 Centriq 2400 伺服器節點就可以提供 48 個並發會話。

用於 Centriq 2400 伺服器處理器的 MariaDB Server 10.2 現在已經可用了。

ScyllaDB 演示表現結果(來自 ScyllaDB)

ScyllaDB 是一種開源的非 SQL 資料庫,實現了兼容 Apache Cassandra 的介面;ScyllaDB 可以直接替代 Cassandra。ScyllaDB 使用一種高性能的 C++ 實現替代了 Cassandra 的 JVM 運行時依賴。這種 ScyllaDB 實現是無鎖的、無共享(shared nothing)的設計,可以通過讓每個核心處理一個資料庫分片來實現擴展。本地內存管理可以實現一致的低於毫秒的每分片內存延遲。

ScyllaDB 對其運行在三個 Centriq 2400 伺服器節點上的資料庫進行了基準研究。根據 boot 設置,其中每個節點的活躍核心數在 10 到 40 之間變化。這項研究表明在三個系統上的性能可以擴展超過 100 萬 IOPS(每秒讀寫操作數),並且隨著每個節點的核心數增加至 40,其性能是線性擴展的。

Excelero 是一家 NVM-Express 模塊化存儲伺服器創業公司,該公司宣布已經得到了來自 Qualcomm Ventures(高通風險投資)的戰略投資並且展示了其運行在 Centriq 上的產品。MegaCard 似乎非常適合 Excelero 的應用,而且可能還能加速 MariaDB 和 ScyllaDB 等資料庫。

微軟 Azure 的傑出工程師 Leendert van Doorn 在演講中還提到:Azure 很看重 Centriq 2400 用於搜索結果和實現大內存資料庫的吞吐處理。van Doorn 指出對於沒有參考位置的查詢(其中每個查詢都有可能訪問該資料庫的不同部分,他將其描述為「在資料庫中隨機遊走」),每個核心都有突出內存系統需求的大量核心能在內存系統上實現更高的綜合性能。

Synopsys 展示了其運行在 Centriq 2400 上的 VCS 驗證模擬和設計包。這只是一個演示。Synopsys 的營銷副總裁 Michael Sanie 說用 VCS 來進行演示很容易並且可以在 Centriq 2400 上順暢地運行。Sanie 很謹慎地沒有將該演示稱為 VCS 的一種「移植(port)」,因為移植就意味著調試的承諾和質量保證。他說 Synopsys 會為一次移植運行「成千上萬次」回歸測試。但他確實說了他不認為進行 64 位 ARM 移植有什麼問題,而且 Synopsys 正在研究將其整個平台移植到 64 位 ARM 處理器上的可行性。Synopsys 和高通已有很長時間的合作夥伴關係,我可以預見 Synopsys 最終會支持「在高通上運行高通(Qualcomm runs on Qualcomm)」的計劃,就像是 AMD 在 2000 年代推出其 Opeteron 產品線一樣。

Cadence 宣布其正在發售用於 ARM 64 位處理器的 Xcelium 設計模擬和驗證軟體應用程序,並且也展示了運行在 Centriq 2400 上的 Xcelium。Xcelium 運行在 SUSE Linux Enterprise 操作系統上。

賽靈思演示截屏

賽靈思展示了一款運行在 Centriq 2400 上的機器學習 Virtex Ultrascale+ FPGA 推理加速棧。機器學習對吞吐量和延遲都很敏感。高通和賽靈思已經合作了多年,並且還在 CCIX 和其它數據中心之外的技術上開展合作。同樣,FPGA 加速將會成為在高通數據中心基礎設施上運行高通的晶元設計的關鍵組成部分。

SmarCo 視頻轉換演示

SmarCo 展示了其「一體式」機器學習平台,該平台基於高通內部一款 Centriq 2400 參考主板設計的變體。SmarCo 使用了基於 PCI-Express 的 FPGA 加速器卡來執行高吞吐量的視頻圖像處理,並且還使用了該公司專有的 SSM3500 PCI-Express 卡(上面有該公司自己的 SmarCo-2 視頻處理晶元)來進行視頻轉換。SmarCo 宣稱在基於 Centriq 2400 的平台上的圖像轉換速度比相當的 x86 平台快 4 倍,圖像檢測的速度也快大約 1.5 倍。

SmarCo 圖像檢測演示

高通參考主板的 SmarCo 「AI All-in-one」 變體

Mellanox Technologies 和 6Wind 展示了網路安全網關,該網關結合了 Centriq 參考平台、Mellanox 當前一代 ConnectX-5 2×40 Gb/sec NIC 和 6Wind 的基於 DPDK 的虛擬網路功能(VNF)軟體。6Wind 在高通發布 Centriq 之前幾周才剛剛宣布支持 ARM 64 位處理器。

Mellanox 和 6Wind 展示 NFV 安全網路(來自:6Wind)

6Wind 的 Virtual Accelerator 和 Turbo IPsec VNF 軟體的目的是為很好地使用在一個服務節點中的多個處理核心來進行擴展,其性能可隨核心數近乎線性的增長。6Wind 運行在 Centriq 2400 上的應用使用了 Ubuntu 的 KVM 系統管理程序(hypervisor)和開源的 Grafana 度量分析和可視化套件。Mellanox 和 6Wind 還展示了一種 Telco Open NFV 實現。

SolarFlare 正在使用其 XtremeScale SDN 網路介面卡和 Centriq 2400 伺服器節點(每個 1U 機箱兩個節點)來為大規模分散式計算環境構建其所謂的「神經類網路(neural class networks)」。每個 NIC 支持多達 2048 個虛擬 LAN 連接,支持在單個機架中放置 76 個 Centriq 2400 處理器(也就是 3648 個核心)。SolarFlare 正在 Centriq 2400 上運行 NGINX 應用交付平台,並且表示還將會支持網路託管和大數據分析。SolarFlare 已經在部署基於 Centriq 的神經類網路了。

Chelsio 宣布 Centriq 2400 參考平台已經可以使用其 T6 Unified Wire 網路解決方案了,該公司還展示了一款乙太網適配器,其在高通的認可供應商列表(AVL)中。

Netronome 宣布 Centriq 2400 已可使用其 Agilio SmartNIC 和軟體。Agilio SmartNIC 可以將用於覆蓋、安全、負載平衡和遠程測量等網路功能的虛擬交換機和路由器數據路徑處理轉移到其它地方。Netronome 的目標是讓包括電信公司在內的雲服務提供商採用其 Agilio with Centriq 解決方案。

Packet Networks 使用亞馬遜 Alexa 前端展示了它的全套工具,這些工具運行在 Packet 數據中心中的 Centriq 2400 參考平台上。Packet 已經在向其軟體開發者(基礎是基礎設施即服務(IaaS)客戶)提供基於 ARM 的裸機伺服器了。裸機伺服器客戶關注的重點是他們所使用的特定硬體,因為裸機是單租戶實例(single tenant instance);開發者必須清楚他們付錢買的是什麼,以便得到能滿足他們需求的最高性能的基礎設施。Packet Networks 已經在為其客戶託管 Centriq 2400 參考平台了,儘管這些平台還沒出現在 Packet 的裸機定價列表上。

此外,Illumina 展示了其運行在 Centriq 2400 平台上的高吞吐量生物信息工具。Canonical 展示了運行在 Centriq 2400 上的 OpenStack 平台,Red Hat 展示了運行在 Centriq 2400 上的 Enterprise Linux for ARM。高通還展示了其內部設計的 MongoDB 演示,其中有 Varnish 服務網路應用、HHVM 網路伺服器和 Spark 內存社交圖譜。

從這裡走向何方?

Anand Chandrasekher 在結束高通的演講時讓我們瞥見了 Centriq 的未來。遵照高通的執行優先(execute first)規則,他並沒說太多。Chandrasekher 只是揭示了下一代 Centriq 核心和處理器的代號,分別是 Saphira 和 Firetail;並且證實第四代正在開發之中。(Centriq 2400 實際上是高通的第二代 SoC 設計。)

高通的 Centriq 大致路線圖

高通在 Centriq 發布會上帶來一個生態系統的策略是很合理的。在此之前,在伺服器生態系統內,還沒有誰曾將 ARM 64 位數據中心生態系統的如此之多的部分放在同一個地方進行展示,而且這些部分還處於如此先進的開發階段。

原文鏈接:nextplatform.com/2017/1

今天是《半導體行業觀察》為您分享的第1484期內容,歡迎關注。

Reading

推薦閱讀(點擊文章標題,直接閱讀)

未到集體唱好京東方的時候

博通入股的穩懋是家怎樣的公司?

取得優越成績後,中國集成電路如何更上一層樓?

關注微信公眾號 半導體行業觀察,後台回復關鍵詞獲取更多內容

回復 科普,看更多半導體行業科普類的文章

回復 DRAM,看更多DRAM的文章

回復 光刻,看更多光刻技術相關的文章

回復 三星,看更多與三星公司相關的文章

回復 全面屏,看更多全面屏相關的文章

回復 雙攝,看更多關於手機雙攝像頭的文章

回復 毫米波,看更多與毫米波相關的文章

回復 IPO,看更多與半導體企業IPO相關的文章

回復 展會,看《2017最新半導體展會會議日曆》

回復 投稿,看《如何成為「半導體行業觀察」的一員 》

回復 搜索,還能輕鬆找到其他你感興趣的文章!


推薦閱讀:

在這項新技術上,中國領先全球
中國的太赫茲技術研究有望領先全球
摩爾定律還能繼續,有技術為證!|半導體行業觀察

TAG:高通Qualcomm | 芯片集成电路 | 半导体 |