全自主的中國超算,重奪第一可期 | 袁嵐峰
來自專欄風雲之聲454 人贊了文章
關注風雲之聲提升思維層次
解讀科學,洞察本質
戳穿忽悠,粉碎謠言
導讀
美國重回超算第一,終結中國五年連續冠軍的新聞又一次刷屏了。在被魚龍混雜的標題黨弄迷糊之前,或許您應該先看看袁嵐峰老師的這篇超算科普文。
文章從中美超算實力比較出發,再逐一解答常見問題——中國超算用的都是外國晶元,所以一錢不值嗎?超算到底有什麼實際應用?和量子計算機有什麼關係?
回到標題,如何看待美國重回超算第一?基本的回答是:這是一個良性競爭。中國也正在發展下一代的超算,可能在不久之後又會重回第一。讓我們拭目以待!
——————————————————————————————————
2018年6月8日,美國能源部橡樹嶺國家實驗室宣布,造出了目前世界上最快的超級計算機,叫做「頂點」(Summit),它的浮點運算速度峰值可達每秒20億億次。
超級計算機「頂點」由一排排電冰箱大小的黑色模塊單元構成,總重340噸。圖片來源:紐約時報
學術界有一個著名的超算500強排行榜,叫做TOP500,自從1993年6月以來,每半年發布一次。目前的TOP500榜單是2017年11月公布的,其中排第一的是中國的「神威太湖之光」,它的浮點運算速度峰值是每秒12.5億億次。
神威太湖之光
第二名是中國的「天河二號」,浮點運算速度峰值是每秒5.5億億次。天河二號曾經在2013年6月至2015年10月的六期榜單中佔據首席,直到2016年6月讓位給神威太湖之光,此後一直保持亞軍到現在。
天河二號
目前的第三是瑞士的「代恩特峰」(Piz Diant),第四是日本的「曉光」(Gyoukou)。由於超算的規模越來越大,能耗越來越高,冷卻和散熱成了重要的問題,所以TOP500組織設計了一個新的榜單GREEN500,以每瓦特功率對應的計算能力來排行,作為對TOP500榜單的一個補充。代恩特峰和曉光在這個方面表現不錯,分別列在GREEN500的第十位和第四位。
你也許會問:TOP500排第三的代恩特峰到了GREEN500排第十,這叫表現不錯?回答是:TOP500的計算能力跨度很大,差一位計算能力就可以差幾倍,而GREEN500的單位功率算力指標跨度卻很小,幾乎全都集中在一個狹窄的區間里。所以GREEN500排在前面的大都是比較小的超算,因為它們設計的時候就特別注重這個指標。例如排第一的是日本的Shoubu system B,它在TOP500上只排在第259位。在這個意義上,代恩特峰排第十確實已經很不錯了,GREEN500也確實只能作為TOP500的一個補充。
2017年11月的GREEN500榜單
目前TOP500的第五是美國的「泰坦」(Titan),這是美國排名最高的超算。泰坦曾經在2012年11月的TOP500榜單中奪冠,但半年後就輸給了天河二號。也就是說,自從2013年以來,中國超算已經佔據TOP500的第一名長達5年了。所以美國對於頂點的發布很興奮,這是美國超算時隔5年之後首次重返第一。
2017年11月的TOP500榜單
目前在TOP500的500台超算中,按照國家來劃分,最多的是中國,202台。其次是美國,143台。第三是日本,35台。然後是德國第四,20台,法國第五,18台,英國第六,15台。基本上,你認為是科技強國的那些國家,就是超算的強國,這兩個集合是高度重疊的。這也可以反映出超算的重要性,它相當於科技界的一種基礎設施。
其實自從TOP500開始發布的1993年以來,美國曾經不止一次地失去速度最快的桂冠,但始終保持著上榜數最多的地位。在這個意義上,你可以說美國一直保持著最強的整體實力,或者用籃球的語言說,板凳的深度最深。在此前一期2017年6月的榜單中,是美國169台,中國160台,當時已經十分接近了。到了2017年11月,兩者的順序終於翻轉,中國第一次在上榜數目上登頂,美國第一次失去這個第一。現在可以說,是中國具有最強的整體實力、板凳深度。
以上是一個大致的背景。我們應該如何看待這些新聞呢?
最最基本的一點值得向公眾科普的是,超算是非常有技術含量的。
在中國的超算佔據首席的5年中,很多人對此不屑一顧。他們以為超算就是處理器堆出來的,有錢多買些處理器,計算能力就上去了。他們還以為中國的超算都是買的外國的處理器,因此計算能力再高也不值一提。我必須指出,這是雙重的誤解。
要澄清第一點誤解,一句話就夠了:現在TOP500排第一的神威太湖之光,用的晶元是中國自己生產的,不是從外國買的。如果你還想了解更多細節,那麼就是神威太湖之光安裝了40960個中國自主研發的「申威26010」眾核處理器,該眾核處理器採用64位自主申威指令系統。晶元叫做「申威」,申請的申,所以超算叫做「神威」,神奇的神,看明白這兩者的關係了吧?
你也許會問:那麼TOP500排第二的天河二號,用的是誰的晶元呢?回答是:天河二號用的是美國英特爾的晶元。
然後,這裡就有一段故事了。天河二號連續四次奪冠後,2015年4月9日,美國商務部就拒絕了英特爾公司向中國的國家超級計算廣州中心出售至強晶元用於天河二號系統升級的申請。中國的國家超級計算長沙中心、廣州中心、天津中心和國防科技大學這四家國家超算中心,被美國列入了出口管制名單。所以你看,美國早就在大動作限制中國超算的發展了。與此同時,美國又宣布要建造3台超過天河二號3-6倍的超級計算機,這次公布登頂的頂點就在其中。這明顯就是一方面要扼殺你,一方面自己要奪回第一。
但是因為中國在自主研發晶元,所以讓美國的限制落了空。美國驚訝地看到中國橫空出來一台神威太湖之光,用的全都是自主晶元,在冠軍位置上又佔據了兩年。大家可以自行腦補美國政府的內心戲,我們在這裡就不越俎代庖了。不但是神威太湖之光,以後中國的超算用的必然也都是自主晶元,因為中國在制定超算髮展規劃時,就已經這麼明確規定了!
以上是第一點誤解,這個很容易理解。要澄清第二點誤解,就稍微複雜一點,需要了解超算的基本原理。
請問,超級計算機為什麼算得那麼快,能夠比個人電腦快成千上萬倍?是因為超算用了一個比個人電腦的晶元快成千上萬倍的晶元嗎?當然不是,世界上沒有這樣的晶元。
實際的辦法是,超算用了很多個晶元,讓它們同時執行任務,而單個晶元的性能跟個人電腦的晶元是差不多的。用科學術語來說,這叫做「並行計算」,這是高性能計算的基本思路。用日常生活來比喻,就是「三個臭皮匠,頂個諸葛亮」!有人指出,這裡的「皮匠」其實不是處理毛皮的工匠,而應該是「裨將」,即主將身邊的副將。無論如何,超算用的遠不止是三個裨將,而是三千、三萬以至更多個裨將。
下一個問題是,如果你用了n個晶元,你的計算速度就是單個晶元的n倍嗎?你立刻就可以發現,不是。實際上,你要讓多個晶元同時幹事,就必須首先給它們劃分好任務,這個任務劃分是要消耗時間的。然後,當各個晶元開始計算之後,還不時地要和其他晶元交換數據,這個通信也是要消耗時間的。因此,計算速度的增長,總是低於晶元數的增長。超算的速度與單個晶元速度的比值,稱為加速比。現在我們明白了,加速比總是低於晶元數的。
當晶元比較少的時候,加速比上升得比較快。隨著晶元數的增加,加速比上升得越來越平緩。當晶元很多的時候,任務劃分和數據通信會變成瓶頸因素,這些負擔的增加會抵消晶元增加的好處,因此加速比會達到飽和,不再上升。由此可見,晶元並不是越多越好的,光靠堆晶元是堆不出超級計算機的。
典型的加速比曲線,橫軸是處理器數目,縱軸是加速比
如果你在大的組織當中做過事,例如大企業、大的政府機構以至大的非政府組織,你就會有很多親身體會,人浮於事、推諉扯皮之類的毛病,在越大的組織中越容易出現。所以,組織並不是越大越好的。超算也是同樣的道理!
現在你可以理解,一台超算能夠容納下多少晶元,並不是取決於有多少錢能用來買晶元,而是取決於架構設計。只有你的系統架構改進了,才能讓更多的晶元發揮作用,達到更高的計算能力。超算的晶元數增加,是一個結果,而不是原因。超算的技術含量,是表現在這裡!不要以為只有晶元是核心技術,超算架構同樣也是核心技術!
例如,天河二號取得突破,最關鍵的技術之一就是中國自製的TH Express-2主幹拓撲結構網路連接,這是世界領先的。天河二號使用光電混合傳輸技術,以13個大型路由器通過576個連接埠以光電傳輸介質與各個運算節點互聯,單個控制器的數據吞吐量2.56 Tbps,終端網路介面使用名為NIC的控制器,以PCI-E 2.0介面鏈接,數據傳送速率為6.36 GB/s。
因此,無論是哪個國家,能在TOP500上名列前茅,都是非常有技術含量的。現在你明白那些認為中國的超算不值一提的人,是犯了多少錯誤了吧?無知導致胡言亂語,人傻就要多讀書。
在澄清了這個最基本的誤解之後,還有一個常見的問題:超算有什麼用?
不要笑,雖然在稍微有點見識的人看來這確實是個可笑的問題。許多人問這個問題,並不是因為他們有證據認為超算沒用,而是因為他們「感覺」中國的就是沒用的。這是一種條件反射,並不是理性思考。
雖然如此,我們還是可以給出一個正經的回答。超算的用途非常廣泛,因為現在有太多的領域可以用計算來模擬了。例如空氣動力學,這對飛機和汽車的設計都是非常基本的,相當於吹一個數值的風洞。又如氣象預測,你想知道颶風的移動軌跡嗎?超算告訴你。又如宇宙的演化,你想知道銀河系是怎麼變成現在這個樣子,以後會變成什麼樣嗎?超算告訴你。我的專業領域叫做理論與計算化學,這個學科的主要內容就是用計算來預測分子的結構、材料的性質,那麼超算的用處就更是一目了然了!
有人也許會問:有什麼必要非要算得那麼快?算得慢點有什麼不可以?
不要笑,雖然這聽起來也是個很可笑的問題,但我們還是可以給出一個正經的回答。有許多問題,我們是希望能實時預測的。例如化工的過程,原料在反應器里如何擴散,如何反應,這是大家十分關心的問題。假如你算得比實際的過程快,那麼你就可以預先操縱。但假如你算得不如實際過程快,那麼你的計算就毫無用處,你還不如老老實實跟著原料走呢,你也就無法操縱了。因此,計算快慢的區別並不一定是80分和90分的區別,而可能是0和1的區別,以至於生與死的區別。前中科院副院長李靜海院士多次強調過,計算能力就是一個國家的核心能力之一。實際上,計算能力永遠沒有足夠的時候,人們永遠都有更高的需求。
在超算業界,有一個最高級的獎項叫做戈登·貝爾獎(Gordon Bell Prize),是授予最傑出的高性能計算應用的,每年頒發一次。理所當然地,獲得戈登·貝爾獎的應用,一般都是在最快的超算上運行的。2016年和2017年,中國連續兩次獲得這個戈登·貝爾獎,獲獎的應用分別叫做「千萬核可擴展大氣動力學全隱式模擬」和「非線性地震模擬」,它們用的都是神威太湖之光。如果你對這兩個名字感到雲里霧裡,那麼只要我跟你說,後面那個就是對唐山大地震的高精度模擬,你就明白這個研究有多重要了吧?
清華大學地球系統科學系副教授付昊桓等共同領導的團隊完成的「非線性地震模擬」獲得2017年戈登·貝爾獎
經常有些白痴認為,中國的超算排第一,只是面子工程,沒有用處。還經常有些白痴認為,中國的超算排第一,是因為超算的性能已經夠用了,其他國家沒有動力發展更快的。現在你可以明白,這些觀點是多麼愚蠢了吧!
當然,中國的超算仍然有需要改進的地方。超算的使用者會注意到一個問題,就是中國的超算應用普及工作還有待加強。雖然我們上榜TOP500的超算數量已經成了全世界最多的,但中國的超算畢竟發展的時間還比較短,許多相關部門和人士還沒有及時跟上這個潮流。例如不同超算的應用界面不一樣,就會讓許多初學者感覺很頭疼,然後就不願意用超算了。
如果中國在衝擊超算性能高峰的同時,各個地區也能夠統籌計算資源,共享系統和硬體,作業全域調配,改善超算的易用性,那麼應用效果就會好得多。事實上,如果學生們能親身體會到國家的計算能力在提升,「太湖之光」、「西湖之光」、「鄱陽湖之光」等等就在身邊,那麼這本身就是一種很好的宣傳。國家應該有一攬子計劃,推動超算的普及。研發更快的超算只是這個計劃的一個環節,後面還有許多工作要做。
下面一個問題,終於是一個相當有技術含量的問題,不像前面有些問題那樣是白痴級別的了。這個問題是:超算和量子計算機是什麼關係?推而廣之,有許多人問:美國的量子計算機是不是已經要取代超算了?還有許多人問:超算是不是已經無所謂了,中國應該在量子計算機上彎道超車?
對此的基本回答是:超算和量子計算機完全是兩回事。當然,它們都很重要,都很值得關注,不過有兩個基本的區別。
第一,超算是一個現實的技術,已經用了很多年,而量子計算機還在實驗室演示階段,離實用還很遠。雖然各國都在努力發展,但量子計算機什麼時候能夠達到實用的程度,還完全無法預測。甚至連這件事能不能做到,都無法定論,大家只是走著瞧而已,因為量子計算機的潛力太大了,哪個國家都不敢放棄。
這第一點區別是很容易理解的,而第二點區別就不是那麼容易了,需要很多背景知識。第二點是,許多媒體常常把量子計算機描繪成無所不能,因為它幹什麼都特別快,——但這是錯誤的!
實際情況是,量子計算機並不是對於所有問題都特別快,而是只對於某些特定的問題比傳統的計算機快。這是因為對這些問題,可以設計出快得多的量子演算法,這些演算法只能在量子計算機上實現,在傳統計算機上不能用。而對於大多數問題,目前並沒有巧妙的量子演算法可用,量子計算機也就沒有優勢可言了。也就是說,量子計算機的優勢,是依賴於問題的,並不是幹什麼都靈,所謂「一力降十會」。
量子計算機擅長的問題雖然還不是很多,但在其中就有一些是非常重要的。例如因數分解,也就是說把21分解成3乘以7這樣。因數分解的困難性,是目前最常用的密碼體系RSA的基礎,因此這是個非常重要的問題。如果量子計算機能夠實用了,那麼我們就可以迅速分解長達幾千位的數字,RSA密碼體系就會迅速被破解,這會造成重大的影響。想想看,如果你的移動支付信息輕易就被破解了,社會會變成什麼樣!
由於篇幅所限,在這裡我們不能詳細地解釋量子計算機的原理。我寫過許多相關的科普文章,有興趣的同學們可以去參考,例如搜索《你完全可以理解量子信息》,這是我寫的一篇對量子信息的全面科普,你讀完以後就可以對這個領域獲得比較充分的了解。
就關於超算的問題而言,量子計算機當然是非常重要的,有顛覆世界的潛力,但發展量子計算機跟發展超算並沒有矛盾。我們現在是兩條腿走路,對超算是作為一個現實的技術來發展,對量子計算機是作為一個前瞻性的研究來發展。
最後一個問題是,在了解了這麼多之後,我們應該如何看待美國重回超算第一,中國的五年冠軍告一段落呢?
基本的回答是:這是一個良性競爭。既然超算是一個這麼有技術含量、又這麼有用的技術,那麼無論哪個國家取得進步,對全人類來說都是好事,都是值得肯定的。大家你追我趕,共同把人類的能力邊界推向前進,這是一個非常積極的景象。
事實上,美國這次奪冠,對於業內人士來說絲毫不意外,因為這些研究項目都是公開的,幾年以前大家就都知道了。中國也正在發展下一代的超算,如果順利的話,可能在不久之後又會重回第一的位置,並且把超算速度從現在的每秒十億億次提高到百億億次的量級。不久是多久?可能是半年。
在2018年5月的第二屆世界智能大會上,國家超算天津中心展示了「天河三號」原型機,這款超級計算機的性能達到了百億億次。天河三號全部採用自主技術,處理器是自主的飛騰晶元,通信是自主的天河高速互聯通信,操作系統是自主的麒麟操作系統。「天河三號」原型機將會在2018年6月部署到天津超算中心,年底的時候會正式投入使用。讓我們拭目以待!
天河三號原型機
更多袁嵐峰的文章:
【科學家專訪】中科大袁嵐峰:做科普是我的幸運 | 科學傳播人
紀念霍金:人是一根會思想的蘆葦 | 袁嵐峰
石墨烯超導和21歲博士生:對科學的宣傳要高調,對個人的宣傳要低調 | 袁嵐峰
量子計算機強在哪裡?不是因為能存下全世界的信息 | 袁嵐峰
量子計算遠沒到可收割的時候 | 袁嵐峰
你完全可以理解量子信息(16.2-完) | 袁嵐峰
致謝:感謝中國科學院計算技術研究所研究員包雲崗博士、西北工業大學力學與土木建築學院教授陳效鵬博士以及科技與戰略風雲學會會員、香港科技大學計算機科學碩士陳經在科學方面的指教。背景簡介:本文作者為袁嵐峰,中國科學技術大學化學博士,中國科學技術大學合肥微尺度物質科學國家實驗室副研究員,科技與戰略風雲學會會長,青年科學家社會責任聯盟理事,微博@中科大胡不歸,知乎@袁嵐峰(https://www.zhihu.com/people/yuan-lan-feng-8)。責任編輯:郭尖尖
歡迎關注風雲之聲
知乎專欄:
http://zhuanlan.zhihu.com/fengyun
一點資訊:
http://www.yidianzixun.com/home?page=channel&id=m107089
今日頭條:
http://toutiao.com/m6256575842
推薦閱讀:
※量子計算機了解一下
※大咖來信 | 張亞勤@2018:終極演算法有待類腦突破,量子計算會指數加速AI
※量子糾纏革命性突破!大規模量子云實驗成功,預示量子應用新時代
※如何設計量子計算機?科學家稱其速度存在理論上限