如何看待國產飛騰2000處理器?
根據飛騰公司公布的數據,該款產品在性能上持平了Intel的E5伺服器晶元。
唉,還是壯著膽子來寫一個可能會被很多同行踩的回答。這個回答無關技術,等我拿到了hotchips的ppt以後再來更新技術的部分。
先說去年這個問題。
如何評價國產處理器——飛騰公司的「火星」? - 硬體
這個問題我之前也寫過一個答案,但是裡面有一些敏感內容提及飛騰競爭對手,覺得不妥於是刪了,現在一年過去,敏感部分去掉,剩下的應該沒問題了,又恢復回來了。
去年hotchips飛騰的報告出來以後,很多很多同行來踩,好些還是我現實生活中認識的,體制內的體制外的,高校的研究院所的企業的,海外的,點贊列表一點開一大堆熟人。。。
爭議的關鍵在於:1. 飛騰的報告做的好不好,2. 飛騰是不是有水平。除了個別以外,很多同行對這兩個點都是負面態度。
確實,對於報告本身,水平不太行,特別是考慮到hotchips的背景下。飛騰的演講視頻出來以後,我從頭到尾看了兩三遍,想找到一些有價值的東西。。。。後面就再也不看了,整個演講大約一多半的內容是過了一遍xiaomi的核心流水線 —— 這裡面的幾乎每一個點都是教科書上的內容,或者是抖露一些大約十幾二十年前工業界就開始採用的典型設計,看得我尷尬症都犯了,這一點那位高票答主確實講的沒錯,這個地我真的是沒法洗。有些人連報告好不好都要辯解一番,我覺得實在沒必要,一者違背良心(起碼我自己對著這個報告真的是說不出好字),二者,其實這場報告的壞影響是可以容易修復的 —— 有實力即可,是金子總會發光的。
然後,關於飛騰晶元是不是有實力的問題就是最大爭議焦點。我當時對各位同行、對來詢問的媒體人士都是堅持這個看法 —— 飛騰是國內第一梯隊的實力。但是很多同行並不這麼想,這個水準不佳的報告可能給了很多人不好的聯想,其實所有的分歧在於,有人(比如我)認為報告雖然不好,但只是水平沒發揮出來,實力本身沒問題,丹有人認為這個報告已經體現了水平,可以踏上一萬隻腳了。。。我後來留心了一下,批評意見最激烈的大多是有海外經歷或者目前已經留在海外的同行,這些同行們中的很多人參與批判了透明計算問題,還有一些人參與了最近的韓春雨事件,對大陸的學術環境是很關心的,我的個人揣測是,這些比較關注大陸學術進展、水平又普遍比我高的同行們對飛騰的失敗報告採取了眼裡容不得沙子的態度,可以理解。畢竟海外的設計水準高於大陸,連我自己看了都覺得膈應的報告,他們看來估計更不能入目了。
我跟那位高票答主通信過,他的想法我大致上了解,事情的起因是雷鋒網登了一篇過分吹捧飛騰的文章,引發了反感,加上國內科研腐敗的大背景,然後出於義憤寫了那個答案,跟著許多同行們的點贊和評論,弄成了現在的樣子。
已經過去一年了,不知道這些同行們有沒有改變想法。
最近三天在威海的ACA 2016和北京的計算所60周年慶上連續聽了飛騰的人做了兩次報告,一次比一次好,特別是廖湘科院士在計算所做的這一次,講了飛騰的整個歷程,從為殲擊機和導彈研製第一第二代晶元,到現在的規模,確實是不容易,當然,相對海外來說差距還是很大的。
記錄了一些廖院士的講話,供大家品味:
1. 過去這些年,三支國家隊(龍芯,飛騰,申威)從國家拿到的自助大概是二十億(我聽見的廖院士原話如此,其他在現場的同行們若察覺有錯漏請補正)。二十億分給三家,還平均到這麼多年,還要開發多款高性能CPU。。。看到現場好些人是苦笑的表情。廖院士說飛騰光是在模擬器上就投了一個多億。
2. 結構設計這個層面大家都比較清楚,欠缺的只是如何在各種設計目標之間平衡的能力。而物理後端是最大短板,即便使用相同工藝,性能也會落後國外競爭對手,另外由於物理設計能力不足,導致結構設計要幫物理設計補鍋。結合當時講話的語境看,這段評論應該是指三大國家隊,廖院士後面補充說華為那邊的物理設計能力應該要更好。
3. 訪存是目前最大瓶頸。
4. 飛騰研發過程中主要使用九所的benchmark,spec是到很後面才加入的。聽廖院士的話頭,似乎spec性能讓位給了九所的高性能計算需求。
5. 呼籲幾隻國家隊加強溝通協作。
純技術的部分之後再補充吧。本來在寫hotchip的評論
http://www.zhihu.com/question/49909769/answer/118393090看到了飛騰的消息,還是隨便說兩句。不認識飛騰的任何人(可能聽過一些名字),信息來源也局限於去年hotchip的資料和ARM公開的信息和個人推理。首先還是恭喜,據說到APM和hotchip都去裝了個逼,卵子都秀飛了。多的不說,一台活生生的機器擺在面前,長臉,也打了不少人臉。
不過嘛,做過晶元的人都知道,這還是第一步,到量產,還這麼大 die size,有的是坑要趟呢,保重。回到晶元架構本身,雖說有些取巧了,但思路挺好。不過嘛,還是有很多值得討論的,畢竟號稱是追平Intel,還沒超越嘛。
specint2006 570分,從單晶元來說是很高,但是從單板角度來說,本身不支持2S擴展,而且靠buffer晶元已經延展了16個DDR通道,從標準的伺服器機櫃來看,一個機框只能支持到1S,內存放不下更多了。 570分一個機框,不算差,但麻麻地。從個人經驗來看,16通道DDR帶寬,不應該只570分,這個帶寬下,該級別64核(2S/1S不重要)還可以沖更高的,我個人經驗來看覺得可以到700分以上的。其中帶寬需求高的MCF、Libquantum、xalan什麼的應該都還能上拉一大截分。
認真想一想問題在哪兒?
小米核(扯上雷布斯總覺得怪怪的),從膠片的信息看,每核獨享L1I和L1D,四核共享L2,蠻像A57的,至少設計者當時應該有參考A57的思路,不過A57是三發射CPU,小米是四發射,相應核內資源也比A57大,也就是說小米的執行能力強於A57,gobmk、hmmer應該會不錯,單核跑分19分也是相當漂亮。但這裡需要值得類比的是A72,A72源於A57,但是A72並不是四發射,而是在三發射不變的基礎上強化了LOAD/STORE能力(A72的手機很多,查查跑分就能看到),也就是說A72的數據讀寫能力強於A57。兩個不同的方向,為啥?嗨,說句不好聽的話,四個核共享匯流排介面,如果不加強LS能力,簡直就是千軍萬馬獨木橋。下圖是飛騰去年膠片截圖,後半截曲線很漂亮吧,請注意前半截。1~8核的位置,可能當時飛騰自己人都沒注意到,否則幹嘛把破綻賣出來。這個破綻,還有和buffer晶元互聯介面帶寬不夠,就是跑分不能繼續上沖的原因吧。單核19分,64核570,不負責猜測8核只有75分。希望飛騰在量產前能改進這裡的問題,分數再上層樓。飛騰的另一個問題好像是不能跑標準OS?
因為沒有任何跑LINUX和windows的消息,原因是什麼? 從SMP的角度,8個NUMA domain數據一致性應該沒問題,膠片中也提到處理了全局時鐘和EVENT,那麼,不負責猜測了一下,缺的是中斷全局分發?不過聚焦國內市場的話,玩玩自定義OS也能賣。此外,飛騰源自NUDT,多P一致性技術應該不成問題啊? 再來個4P裝逼就起飛了。
更新一句,最新的資料表示每個核@2GHz的得分是12.4分而不是HC膠片的19分,這尼瑪就扯淡了,前面的分析全部作廢。12分是A57的結果啊,這不就是A57了么? 增加的多一個發射是有BUG關掉了? 奇怪的CPU,搞不懂了。鏈接: 如何評價國產處理器——飛騰公司的「火星」? - 硬體。這個是之前FT2000在Hotchips上PPT發布時,參與者眾多的評論。
現在「火星」的正式產品飛騰公司:FT-2000系列,已經上線。這肯定會讓某些人難堪了。
油管上有HC27的全部演講視頻,下面的視頻是飛騰演講的部分,已經被搬運到了牆內。HotChips2015 Phytium Mars 演講大家可以仔細看看,上面鏈接中排名第一的答主所說的演講中的那些問題,基本子虛烏有。然後,
據網站介紹:FT-2000系列晶元可以為國內外合作夥伴提供開發板和參考設計。國產操作系統和國產軟體產品已完成了FT-2000系列晶元平台上的全面適配工作。主要技術指標:
FT-2000/64與當初Mars的PPT比較有2點值得注意的變化:1、集成8個自定義擴展介面,每個介面提供19.2GB/s的有效讀寫帶寬。這個規格超過haswell Xeon E7。其自定義的擴展介面不但可以用來擴展緩存容量和存儲能力,還可以用來外接FPGA等加速器類專用晶元,實現異構計算。這個介面明顯是用於天河超級計算機的。2、最大功耗100W,比Mars的PPT介紹的少了20W,其性能功耗比超過預期。飛騰1500A性能相當於2011年Sandy Bridge E5 v1水平,估計飛騰2000會趕上Ivy Bridge E5 v2。intel黑科技太多,目前到了Broadwell E5 v4,領先5年。。。
飛騰公司只說E5,沒說E5哪代哪個型號,從2011年到2016年都叫E5
幾個弱點:不支持DDR4、主頻太低、不支持hyperthread、不支持turbo、不支持TSX、虛擬化很慢。不過FT2000對於中國來說也算是進步了,基本追平日本的服務器SoC水平
未來10年是intel/arm決戰5G基礎設施的時代,華為等中國系廠商和日本韓國等基本會倒向arm,將對戰思科愛立信諾基亞的歐美intel聯盟,arm64服務器便是其中重要一環,intel現在推廣的5G方案就是datacenter和infrastructure都使用x86_64架構的雲計算方案,其他ISA如powerpc/sparc因為無法同時覆蓋datacenter和infrastructure將會出局。即使arm64服務器性能暫時不濟,亞洲廠商也會投入巨大資金研發至少10年外行不懂,不過對跑分數據有點疑惑。
1. spec網站上還查不到FT-2000具體的benchmark results。
2. http://www.wokeji.com/explore/qykj/201608/t20160825_2804660.shtml?from=groupmessageisappinstalled=0#10006-weixin-1-52626-6b3bffd01fdde4900130bc5a2751b6d1這裡報道中稱:
「SPECint_rate2006測試分值570分,SPECfp_rate2006測試分值482分」並未給出跑分的具體配置。同時,報道並未給出SPECint2006和SPECfp2006這兩個單核指標。對於CPU來說,僅看多核吞吐量是不夠的(核心數越多越好?)。並且沒有其他的實際性能指標,僅僅看這兩個指標就說性能上持平E5-2699 v3是否太過草率?3. 功耗100W如果確實是真的,那的確要比E5-2699 v3來的好。話說降低功耗也是近幾年INTEL x86_64重點照顧的對象。
4. 量產後的實際性能未知。
附E5-2699 v3 SPEC性能我只能想到奔騰……
8月2號 APM上就已經展示過事物了,鏈接在這「麒麟+飛騰」亮相APM大會,展現中國ARM生態新魅力性能參數在hotchips28的正式報道,http://www.wokeji.com/explore/qykj/201608/t20160825_2804660.shtml?from=groupmessageisappinstalled=0#10006-weixin-1-52626-6b3bffd01fdde4900130bc5a2751b6d1
推薦閱讀: