最新一期全球超級(jí)計(jì)算機(jī)TOP500榜單今日公布,中國(guó)自主研發(fā)制造的神威太湖之光取代天河2號(hào)名列第一,這個(gè)消息立即刷爆朋友圈。中科院計(jì)算所研究員、中國(guó)計(jì)算機(jī)學(xué)會(huì)青年計(jì)算機(jī)科技論壇(CCF YOCSEF)主席韓銀和第一時(shí)間給出點(diǎn)評(píng):
“太湖之光為啥這么牛?它擁有一顆巨強(qiáng)的“芯”-申威26010,上海高性能IC設(shè)計(jì)中心設(shè)計(jì)的國(guó)產(chǎn)高性能處理器。該處理器包含有260個(gè)處理核,單片峰值性能為3.06Tflops/s。天河-2單節(jié)點(diǎn)采用2個(gè)Intel Ivy Bridge處理器+3個(gè)Intel Xeon Phi類(lèi)GPU加速器芯片,這5個(gè)處理器芯片峰值性能相加約為3.431Tflops/s,也就是說(shuō)一顆申威芯片性能大致相當(dāng)于天河-2中Intel 5個(gè)芯片的峰值性能之和!”
韓銀和還總結(jié)了太湖之光的3個(gè)亮點(diǎn):(1)總性能93P,比天河-2又快了3倍,比第3名美國(guó)橡樹(shù)嶺實(shí)驗(yàn)室的機(jī)器快了5倍,是第一臺(tái)性能接近100P的機(jī)器;(2)采用了全國(guó)產(chǎn)眾核處理器;(3)能效比達(dá)到6GFlops/W, 和Green500第一的日本機(jī)器能效比也就差不到10%,但太湖之光比日本機(jī)器規(guī)模大多了,這么大個(gè)頭能效比控制的這么好,需要有獨(dú)到的技術(shù)。
6月20日,第 23 屆高性能計(jì)算(HPC)國(guó)際頂尖會(huì)議 ISC2016 在德國(guó)法蘭克福舉行,會(huì)上提前公布第 47 次 HPC TOP500 榜單,中國(guó)的神威太湖之光系統(tǒng)(Sunway TaihuLight System)排名第一。
神威太湖之光系統(tǒng)
在國(guó)家超級(jí)計(jì)算無(wú)錫中心1000平米的主機(jī)房?jī)?nèi),整齊排布著兩組共40個(gè)運(yùn)算機(jī)倉(cāng),每個(gè)機(jī)倉(cāng)容納1024個(gè)芯片,共計(jì)40960個(gè)芯片。據(jù)介紹,其單芯片的計(jì)算能力相當(dāng)于3臺(tái)2000年全球排名第一的超級(jí)計(jì)算機(jī),當(dāng)前性能指標(biāo)達(dá)到國(guó)際領(lǐng)先水平。
3 大突破
神威太湖之光由國(guó)家并行計(jì)算機(jī)工程技術(shù)中心研發(fā),在無(wú)錫國(guó)家超算中心安裝完成,2015年12月21日完成整機(jī)系統(tǒng)性能測(cè)試,目前由清華大學(xué)負(fù)責(zé)運(yùn)營(yíng)。
神威太湖之光運(yùn)算峰值為 125.4 Pflop/s,持續(xù)性能 93 Pflop/s,比天河 2 號(hào)快了將近 3 倍,比排名第 3 的美國(guó)橡樹(shù)嶺實(shí)驗(yàn)室的機(jī)器快了 5 倍,也是國(guó)際第一臺(tái)性能接近 100P 的機(jī)器。
美國(guó)Titan、天河二號(hào)、太湖之光參數(shù)對(duì)比
神威太湖之光每瓦特浮點(diǎn)運(yùn)算次數(shù)達(dá)到了 6 億次(世界排名第 2 到第 6 的超級(jí)計(jì)算機(jī),這個(gè)數(shù)值都在 2 億次左右),也即能耗比達(dá)到 6 Gflops/W,與 Green500 第一的日本機(jī)器相差不到10%,但太湖之光規(guī)模明顯更大,因此實(shí)現(xiàn)的技術(shù)獨(dú)到。目前,世界排名前 10 的其他超級(jí)計(jì)算機(jī)能耗比都在 2 Gflops/W 左右。
國(guó)家超級(jí)計(jì)算無(wú)錫中心主任楊廣文教授在接受采訪時(shí)表示,神威太湖之光一分鐘的計(jì)算能力相當(dāng)于全球72億人同時(shí)用計(jì)算器不間斷計(jì)算32年。
楊廣文說(shuō):“從低功耗、高集成度的處理器設(shè)計(jì),到高速高密度的工程實(shí)現(xiàn)技術(shù);從世界領(lǐng)先的高效水冷技術(shù),到軟硬件協(xié)同、智能化的功耗控制方法,‘神威太湖之光’實(shí)現(xiàn)了層次化、全方位的綠色節(jié)能,功耗比達(dá)到每瓦特60.51億次運(yùn)算。”
世界TOP6超級(jí)計(jì)算機(jī)參數(shù)
中國(guó)“芯”,No Intel Inside
ISC TOP500 榜單每年公布兩次,根據(jù)超級(jí)計(jì)算機(jī)基準(zhǔn)程序 LINPACK 測(cè)試值,評(píng)選全球最強(qiáng)超級(jí)計(jì)算機(jī)。
雖然我國(guó)處理器設(shè)計(jì)制造起步較晚、基礎(chǔ)薄弱,但通過(guò)近十年政府支持和大力投入,目前我國(guó)在超算領(lǐng)域已經(jīng)處于世界領(lǐng)先水平,也是繼美國(guó)、日本之后,第 3 個(gè)研發(fā)出超級(jí)計(jì)算機(jī)的國(guó)家。
位于廣州國(guó)家超級(jí)計(jì)算中心、由國(guó)防科技大學(xué)建造的天河 2 號(hào),2013 年 6 月以 33.86 Pflop/s 的 LINPACK 測(cè)試值奪得TOP500 第一,并在接下來(lái)的 6 次榜單中蟬聯(lián)冠軍。
過(guò)去幾年,中國(guó)工業(yè)和研究部門(mén)注冊(cè)提交的系統(tǒng)數(shù)量劇增,中國(guó)現(xiàn)在入榜的超級(jí)計(jì)算機(jī)數(shù)量達(dá)到167臺(tái),超過(guò)美國(guó)的165臺(tái)。
這也是TOP500榜單美國(guó)入圍的超級(jí)計(jì)算機(jī)總數(shù)量首次跌下第一位。
1993年至今中國(guó)TOP500超級(jí)計(jì)算機(jī)數(shù)量
1993年至今美國(guó)TOP500超級(jí)計(jì)算機(jī)數(shù)量
但由于天河 2 號(hào)采用了英特爾處理器,2015年4月,美國(guó)宣布對(duì)中國(guó)禁售高性能處理器。
這次,神威太湖之光使用我國(guó)自主研發(fā)和制造的 CPU 處理器——申威 26010(SW 26010),采用眾核+CPU架構(gòu),含有將近 1065 萬(wàn)個(gè)內(nèi)核,主內(nèi)存 1.31 PB。
申威260140芯片
搭載了兩個(gè)核心組的電路板
SW 26010的芯片由上海高性能集成電路設(shè)計(jì)中心研發(fā),含有 4 個(gè)核心組,每組含有 65 個(gè)內(nèi)核,由64個(gè)計(jì)算核心(CPE)、一個(gè)管理核心(MPE)和一個(gè)內(nèi)存控制器構(gòu)成。
神威太湖之光核心組示意圖
64個(gè)計(jì)算核心排列為8x8的矩陣。4個(gè)內(nèi)存控制器總共提供了136.5GB/s的帶寬。
每組內(nèi)部有自己的專(zhuān)屬內(nèi)存空間,組間通過(guò)片上網(wǎng)絡(luò)(NoC)進(jìn)行通訊。片上網(wǎng)絡(luò)還連接著系統(tǒng)接口(SI),供芯片同外部設(shè)備通訊。
神威太湖之光架構(gòu)示意圖
神威太湖之光專(zhuān)為提升運(yùn)算速度設(shè)計(jì),簡(jiǎn)單的架構(gòu)正是它運(yùn)算速度勝過(guò)其他高能耗 HPC 系統(tǒng)的原因。
不過(guò),申威芯片采用定制64位指令集,頻率處于中等水平(1.45GHz),而且每個(gè)核心只能執(zhí)行一個(gè)線程(不支持超線程),軟件支持也沒(méi)有Intel那么豐富。
但盡管如此,中國(guó)憑借一個(gè)完全基于中國(guó)設(shè)計(jì)、制造的處理器打造的新系統(tǒng),在國(guó)際TOP500組織第47期榜單上保持第一,TOP500聲明中這樣寫(xiě)道。
實(shí)現(xiàn)零的突破
除了TOP500,戈登貝爾獎(jiǎng)(Gordon Bell Prize)也是世界關(guān)注的重點(diǎn)。
戈登貝爾獎(jiǎng)被喻為 HPC 應(yīng)用領(lǐng)域的諾貝爾獎(jiǎng),每年頒發(fā)一次,授予 HPC 領(lǐng)域杰出表現(xiàn)應(yīng)用,旨在記錄變形計(jì)算發(fā)展趨勢(shì),尤其是獎(jiǎng)勵(lì)高性能計(jì)算創(chuàng)新應(yīng)用。獲獎(jiǎng)應(yīng)用多為性能峰值最高,或在可擴(kuò)展性方面取得特殊成就,或縮短及重大科學(xué)或工程問(wèn)題時(shí)間。
2016年的6項(xiàng)提名中,神威太湖之光占了一半,分別涉及大氣、海洋、材料三個(gè)領(lǐng)域的應(yīng)用:一個(gè)完全隱藏的非靜力動(dòng)態(tài)解算機(jī),用于云分解大氣層模擬;一個(gè)高效的全球表面波,用超高的分辨率進(jìn)行數(shù)值模擬;大規(guī)模的相場(chǎng)模擬,用于基于Cahn-Hillard方程的粗化動(dòng)力,加上減少的移動(dòng)性。
過(guò)去24年至今,世界排名第一的超級(jí)計(jì)算機(jī)
加速人工智能
航空航天、石油勘探、車(chē)船設(shè)計(jì)、軍事應(yīng)用、新藥研發(fā)、生物信息、氣候模擬……超級(jí)計(jì)算廣泛應(yīng)用在從實(shí)體經(jīng)濟(jì)到戰(zhàn)略領(lǐng)域的諸多方面。因此,超級(jí)計(jì)算不僅僅是學(xué)術(shù)研究,也涉及國(guó)家政治問(wèn)題。
HPC 是世界各國(guó)競(jìng)相角逐的科技制高點(diǎn)。
神威太湖之光采用中國(guó)自主設(shè)計(jì)和研發(fā)的芯片,在超算領(lǐng)域樹(shù)立了新的標(biāo)桿,在美國(guó) X86 之外建立了新的生態(tài),可以說(shuō)中國(guó)有了自己的產(chǎn)業(yè)鏈,未來(lái)還可能向其他國(guó)家輸出。
不僅如此,HPC 也是人工智能技術(shù)尤其是機(jī)器學(xué)習(xí)發(fā)展的關(guān)鍵之一,眾所周知,訓(xùn)練神經(jīng)網(wǎng)絡(luò)除了數(shù)據(jù),還需要巨大的計(jì)算能力。
神威太湖之光在 HPC 領(lǐng)域的成功,定能極大推動(dòng)我國(guó)智能產(chǎn)業(yè)發(fā)展。
接下來(lái),中國(guó)制造的神威太湖之光,將為全球提供超級(jí)計(jì)算服務(wù)。
(審核編輯: 滄海一土)
分享