超算的真正較量:美國重登第一,中國怎麼辦?

超算的真正較量:美國重登第一,中國怎麼辦?

來自專欄知識分子97 人贊了文章

?國家超級計算無錫中心。攝影:邸利會

撰文 | 邸利會(《知識分子》主筆)

責編 | 李曉明

知識分子為更好的智趣生活 ID:The-Intellectual

● ● ●

6月25日,在德國法蘭克福舉行的2018國際超算大會上,最新一期Top500全球超算排行榜即將正式發布,美國橡樹嶺國家實驗室的超級計算機Summit,不出意外將以峰值計算性能每秒20億億次(200 PFlops)的速度登頂全球最快超級計算機。

中國的天河二號和神威太湖之光讓出了已經佔據5年的第一的位置。不過,在業內人士看來,Summit已經比預計的日期延後了一年,而中國並非不能造出200PFlops的機器,只不過各有自己的既定發展節奏。爭奪世界最強計算機固然重要,但超算的真正較量,絕不止是看誰是第一那麼簡單。

1.中看更中用

雖然過去了很多年,付昊桓還記得這麼一個故事。那是在2010年的11月,天河1A首次成為世界上最快的計算機。中國超算界的專家都很高興,畢竟「最快」這個榮譽,幾十年來由美、日壟斷,其他國家未曾染指。

不過,在天河1A摘取世界第一桂冠的美國超算大會現場,就有美國專家發問,中國現在有實力構建全球最快的超級計算機,但是否能用最快的機器來解決最頂尖的科學或者工程問題?在這位專家的眼中,這台龐然大物,也許是「中看不中用」。

這位專家的指摘雖然尖銳刺耳,但是的確反映了一個事實:造出最快的計算機固然不錯,能否真正發揮作用才是根本。

也差不多那個時候,付昊桓從斯坦福回到了清華,加入到剛成立不久的地球系統科學系。也是從參會回來的同事口中,付昊桓聽說了這段故事。當時,天河1A採用的是英特爾的處理器和英偉達的GPU加速器,在上面跑大型的應用程序也才剛剛起步。

「我回到清華後的第二年,2011年的時候,比較湊巧,我們幾個人在那一年中慢慢地結識。我先是認識了薛巍老師,然後經薛老師介紹,又認識了楊超老師。」付昊桓說。

在清華大學計算機系的薛巍教授此前從事電力電網研究,之後又擴展到氣候模擬等其他應用領域。中國科學院軟體研究所楊超研究員則從事計算數學的研究。付昊桓那時正對新的計算架構著迷。「因為天河1A是CPU加GPU,主要的計算力由GPU加速器來提供。所以要把它高效用起來,就得把GPU用好了。我們當時就組了一個團隊,想把這個機器用起來,解決大氣模擬的問題。」 付昊桓告訴《知識分子》。

從天河1A開始,短短几年內,中國先後推出一系列超級計算機,不斷刷新「最快」紀錄。2011年10月,落戶濟南的「神威藍光」,全部採用國產處理器和系統軟硬體,峰值計算超千萬億次。2013年6月,由國防科學技術大學研製的「天河二號」 以每秒5.49億億次的峰值計算速度,成為「全球最快」。2016年6月,由國家並行計算機工程技術研究中心研製的「神威·太湖之光」,峰值計算速度達到每秒12.5億億次,性能也更加穩定。從2013年6月算起,來自中國的超級計算機已佔據TOP500榜單第一位置達五年之久。

六年間,變化的不僅是越來越強悍的機器。

?在美國丹佛舉行的2017國際高性能計算大會上,基於神威·太湖之光的非線性大地震模擬應用,贏得了超算應用領域最高獎項:戈登貝爾獎。圖片由受訪者提供。

2016年11月,在美國鹽湖城舉行的國際超算大會上,由楊超、薛巍、付昊桓等人聯合北京師範大學組成的研究團隊獲得了「戈登·貝爾」獎。這一高性能計算應用領域的最高獎,幾十年也由美、日等超算大國壟斷。中國不僅打破了這一紀錄,而且在入圍的6項應用中佔了3席。2017年11月,由付昊桓領銜的交叉團隊再次獲得該獎項。付昊桓現為清華大學地球系統科學系副教授,國家超級計算無錫中心副主任。

驀然回首,世界超算的格局已然改變。

2016年,在一份有關高性能計算的報告中,美國國家安全局和能源部認為,中國超算已經和美國接近並跑(near-peer),對其國家安全、經濟社會、超算行業等造成威脅,若再不加大投資,尋求改變,美國將失去其領導地位。

而今,再不會有人認為,中國的超級計算機只是個龐然大物。「太湖之光對中國來說是重要的進展,確實,其每秒93Pflops的速度比美國能源部所有的計算機總和還要高;更重要的是,此前中國的超算系統除了在跑標準(比如LINPACK測試)外沒有太多大規模應用,可這次在太湖之光上面大型程序是能很好的運行的。」 該報告說。

如今,超算這一領域的最強爭奪,已經成了中國、美國、日本等少數幾個國家之間的競爭。6月25日,美國橡樹嶺國家實驗室的Summit正式發布,重回第一。不過,業內都清楚,誰擁有第一強的機器,僅僅只是超算較量的其中一步。

?神威·太湖之光。攝影:邸利會

2.打造完善的生態系統

利用太湖之光強大的計算能力,付昊桓目前所做的工作,希望為科學家研究地震發生的機制提供更為準確的模擬平台,同時為抗震防震提供量化評估工具。自去年模擬唐山大地震獲得「戈登·貝爾」獎之後,他的團隊把目標瞄向下一個更艱巨的目標,模擬汶川地震。

十年之前的5月12日,發生在四川汶川的地震造成近7萬人死亡,37多萬人受傷,17多萬人失蹤,震驚世界。可與預報天氣不同,面對無法直接探測的地殼深部結構,地震的數值預報目前還是不可解的難題。退而求其次,付的團隊打算運用超級計算機模擬地震的震源產生、地震波傳播過程,針對特定區域完成基於地震過程情景模擬的震害預測,量化評估地震強度及震害分布。精確的模擬,對於降低與預防地震災害所帶來的巨大損失,以及開展地震高發區的合理規劃與設計,均可發揮重大作用。

在汶川地震中,大量的山體崩塌、滑坡掩埋村鎮,形成堰塞湖,危及成千上萬人的生命。付的團隊打算與成都理工大學研究山體滑坡的團隊合作,研究地震會不會觸發山體滑坡,會觸發什麼樣的山體滑坡。此外,他們也與建築防震專家合作,將地震的模型與建築的模型連接起來,研究發生地震後會對建築造成怎樣的損害。「像美國的加州地區也是地震頻發,那裡人們買房子都要購買地震的保險。而每棟房子保險的定價,背後依靠的就是是基於地震模擬的量化風險評估。」 付昊桓介紹說,地震相關的產業服務離不開精確的模擬。

從地震模擬、大氣模擬、海洋模擬,到鈦合金微結構模擬、托克馬克逃逸電流模擬、蛋白質冷凍電鏡三維電子結構計算,科學家正利用超級計算機解決重要的科學問題。除了科學方面的用戶,各個超算平台也接納了不少企業的用戶——他們想設計新型的飛機發動機,船舶,還有風力發電的渦輪機葉片。超算已成為支撐智能製造、提升經濟質量不可或缺的重要一環。

超算平台大量投資的背後希望換回的是更大的社會經濟效益。以神威太湖之光為例,18億元的投資,除了中央財政的投入,江蘇省和無錫市各出資6億。此外,無錫市還負責日常的運營費用,包括負擔15兆瓦的功耗(大概相當於3個清華大學的耗電量)。無錫市希望通過超算平台吸引從事人工智慧、智能製造、工業大數據的企業和研究人員,其建立的超算產業園,也希望能惠及當地經濟發展。

作為國家超級計算無錫中心主任,楊廣文利用一切機會推介神威太湖之光。在去年6月的一個論壇上,在介紹完神威後,他懇切地對觀眾說,希望大家能把這個國家重大裝備用好,解決重要的科學問題,促進產業升級。「我想說,超算大家聽上去是高大上的,也是國家戰略,但是否會把它做成一個可持續發展的(產業)?超算人也想成功。」 他說。

在前述的美國國家安全局和能源部的報告中,也認為中國超算的發展將威脅美國的經濟:「高性能計算領導地位的損失潛在地威脅到已經重度使用高性能計算的行業內的美國公司。這些行業包括汽車、航空航天、先進位造、石油勘探、製藥研究、金融等。這些行業在全球範圍內已經具有強的競爭性,因此美國競爭力的些許損傷(例如,如果中國用其高性能計算領導地位為其國內產業提供廉價甚至免費的計算能力)就會轉化成更大的經濟效應。同樣也會帶來重大的知識產權風險:如果一家製藥公司的藥品開發在海外進行,那麼IP泄漏在多大程度上會阻礙美國的競爭力?」

而對於中國而言,有些行業的發展(如飛機發動機的設計)也到了一定的程度,必須自行開發軟體,而不可能像過去那樣,直接拿國外的商業軟體使用。「包括飛機也好,高鐵也好,還主要是依賴國外的商用軟體在進行設計和模擬,下一步我們希望基於神威的平台,特別是和這些應用單位深入合作去做我們自主工業模擬和設計的軟體平台。」 付昊桓說。

從採用國產的處理器,到編譯器,操作系統,各種計算庫,開發框架,中國的超級計算機試圖構建一套自己的生態系統,而要真正進入良性的發展還依賴於用戶的使用和反饋,他們是超算社群至關重要的一環。

3.期待整個青藏高原

2015年4月9日,美國商務部發布公告,禁止向中國的4家國家超級計算中心出售英特爾「至強」晶元。有外界評論認為,此番禁運可能和天河二號多次佔據超級計算機高性能榜首有關。緊接著2015年年底,中國推出神威太湖之光,取代天河二號,繼續成為最快的計算機,且使用的是全國產晶元。

不過,這兩件事情之間僅僅是一種「巧合」,二者並沒有直接的聯繫。此前的「神威藍光」就已經採用了全國產晶元,神威太湖之光從開始設計之初就是全國產,只不過按照預期的進度推出而已。

這恰如此次美國Summit的推出(其實已比預期延後了一年),對於超算界來說,都是意料中的事。「200P,300P我們能不能造出來?其實是可以造出來的,只是說大家規劃的節奏不一樣。」 付昊桓解釋道。

目前,世界各國正準備建造下一代E級計算機(100億億次),將計算能力推向一個新的高度。關於為何建造E級計算機,TOP500發起人、橡樹嶺國家實驗室及田納西大學Jack Dongarra教授在上個月南昌舉辦的ASC會議期間告訴《知識分子》:「不是我們要造下一代計算機,而是科學家提出了更困難的挑戰,更難的問題(需要這樣的計算機),E級的計算機只是我們發展中間跨越的一個障礙物,以後還會有更高量級的計算機出現。」

《知識分子》了解到,E級計算機,中國目前有三家機構正在獨立研發,預計將於2020年推出。而對於中國的超算來說,更為重要,也更為長遠的任務,也許是整個生態系統的建設。

「單純從超算而言,無論是硬體系統,還是部分領域的軟體應用,中國都已經有和美國、日本比肩的突破性成果。但要能夠對超算背後的諸多產業都能形成一個正面的反饋,還需要較長的時間。比如基於超算的天氣及氣候預測、工業設計和模擬、新材料的製備、新葯研發等等,任何一個行業與超算硬體及軟體的融合,都能產生巨大的產業提升。我們現在有了超算技術的突破,下一步應該期待如何實現對產業的輻射和支撐。」付昊桓說。

對於中國的超算來說,現在有了一個珠穆朗瑪峰,下一步或許應該期待整個青藏高原。

參考文獻:

1. U.S. Leadership in High Performance Computing (HPC): A Report from the NSA-DOE Technical Meeting on High Performance Computing, December 1, 2016.

2. Haohuan Fu, Conghui He, Bingwei Chen, Zekun Yin, Zhenguo Zhang, Wenqiang Zhang, Tingjian Zhang, Wei Xue, Weiguo Liu, Wanwang Yin, Guangwen Yang, Xiaofei Chen: 18.9-Pflops Nonlinear Earthquake Simulation on Sunway TaihuLight: Enabling Depiction of 18-Hz and 8-Meter Scenarios, the International Conference for High Performance Computing, Networking, Storage and Analysis (SC 2017), Denver, USA, November, 2017. (ACM Gordon Bell Prize)

製版編輯:斯嘉麗 |

本頁刊發內容未經書面許可禁止轉載及使用

公眾號、報刊等轉載請聯繫授權

copyright@zhishifenzi.com

商務合作請聯繫

business@zhishifenzi.com

知識分子為更好的智趣生活 ID:The-Intellectual


推薦閱讀:

形似而神不似,仿生機器人如何突出重圍?
為什麼寢室寬頻介面會有人說話的聲音?
屠呦呦偉大之處,是為全人類抗瘧疾事業從0突破到1 | 科技袁人
[轉帖]喬布斯遺產:人性的科技
遲到的小米8沒有「很嚇人」的技術,還可能成新的「滑鐵盧」

TAG:美國 | 超級計算機 | 科技 |