美國謀求重新奪回超級計(jì)算機(jī)霸主地位;
IBM 終于開始出貨其獨(dú)具風(fēng)格的 Power9 處理器;
英偉達(dá)的 Volta GPU 將成為 Summit 和 Sierra 的主力計(jì)算單元。
美國欲憑借 Summit 超級計(jì)算機(jī)重回世界之巔
計(jì)算機(jī)領(lǐng)域的軍備競賽對國際關(guān)系和地緣政治的影響和其它任何常規(guī)軍備競賽一樣重要。這是一場關(guān)于打造出全球最快的超級計(jì)算機(jī)的競賽。擁有最快的超級計(jì)算機(jī)不僅僅關(guān)乎民族自豪感,它還具備貨真價(jià)實(shí)的經(jīng)濟(jì)、政治和軍事利益。超級計(jì)算機(jī)有諸多用武之地,不僅可以用于大范圍地區(qū)的天氣預(yù)報(bào),還可以用于核武器的建模和設(shè)計(jì)。
目前,世界上最快的超級計(jì)算機(jī)是中國的神威·太湖之光,其運(yùn)算能力能夠達(dá)到驚人的 93 PetaFLOPS,即每秒執(zhí)行 93×10 ^ 15 次浮點(diǎn)運(yùn)算。 2018 年,美國計(jì)劃在田納西州的橡樹嶺國家實(shí)驗(yàn)室(ORNL)打造出超過神威·太湖之光的超級計(jì)算機(jī)。這臺(tái)名為 Summit 的超級計(jì)算機(jī)的運(yùn)算能力將達(dá)到 200 PetaFLOPS,同時(shí),加利福尼亞州的勞倫斯利弗莫爾國家實(shí)驗(yàn)室也正在建造一個(gè)設(shè)計(jì)上與 Summit 類似的姊妹計(jì)算機(jī) Sierra。
Summit 由大約 4600 個(gè)“節(jié)點(diǎn)”組成,這些節(jié)點(diǎn)基本上都是機(jī)架式服務(wù)器。雖然 Summit 的計(jì)算能力將比其前任強(qiáng)大 5-10 倍,但它的節(jié)點(diǎn)只有前任的 1/4,而且耗電量也大大降低。
這臺(tái)超級計(jì)算機(jī)這么強(qiáng)悍,靠的是這些節(jié)點(diǎn)的特殊內(nèi)在。每個(gè)節(jié)點(diǎn)都包含一個(gè)由 IBM 設(shè)計(jì)的專用 HPC(高性能計(jì)算)服務(wù)器。 該節(jié)點(diǎn)包含兩個(gè) IBM Power9 處理器、六個(gè)英偉達(dá)的 Tesla V100 SXM2 GPU 加速器,而且整個(gè)盒子采用水冷設(shè)計(jì),如文章頂部的硬件照片所示。該硬件最近曾在全球超算大會(huì) SC17 上展出過。
IBM 系統(tǒng)的獨(dú)特之處在于,每個(gè) Power9 處理器都通過英偉達(dá)專有的高速 NVLink 數(shù)字接口直接與英偉達(dá)的 GPU 通信。 這種內(nèi)置功能是 Power9 獨(dú)有的,可通過 NVLink 2.0 實(shí)現(xiàn) 100 GB/ 秒的吞吐能力。
如 Tom 硬件的圖中所示,整個(gè)系統(tǒng)架構(gòu)廣泛使用 NVLink 連接各個(gè) Power9 處理器、各個(gè) GPU,并將 GPU 和 Power9 處理器互相連接在一起。
在實(shí)際工作中,由這些 Power9 處理器協(xié)調(diào)每個(gè)節(jié)點(diǎn)的計(jì)算流程,Tesla V100 則負(fù)責(zé)繁重的計(jì)算工作。IBM 將 NVLink 2 接口集成到芯片上這個(gè)設(shè)計(jì)決策表明它深諳高性能計(jì)算的發(fā)展方向。IBM 并沒有抗拒越來越流行使用 GPU 進(jìn)行計(jì)算的趨勢,而是明智地選擇了它。
IBM 終于開始出貨其獨(dú)具一格的 Power9 處理器
每顆 Power9 處理器本身就是一臺(tái)功能強(qiáng)大的計(jì)算機(jī),最多可包含 24 個(gè)處理器內(nèi)核,每個(gè)內(nèi)核可以并行執(zhí)行四個(gè)線程,Power9 支持 96 個(gè)線程的并行計(jì)算。此外,每顆 Power9 還支持 48 路 PCIE 4.0 通道和 8 個(gè)內(nèi)存通道。
IBM 的 Power 處理器系列基于 PowerPC RISC 架構(gòu),曾經(jīng)用在蘋果的 Mac 電腦上,當(dāng)蘋果公司改用英特爾的 x86 處理器后,IBM 將重點(diǎn)放在了服務(wù)器市場上。
客戶早就對 Power9 望眼欲穿,IBM 去年發(fā)布了這顆芯片,人們普遍預(yù)計(jì) IBM 將在 2017 年年底出貨這顆芯片。根據(jù)目前得到的消息,Power9 已經(jīng)應(yīng)用在 Sierra 和 Summit 上,但是 IBM 并沒有公布 Power9 全面供貨的信息,現(xiàn)在業(yè)界認(rèn)為該芯片可能于 2018 年初上市銷售。
Power9 是一個(gè)龐大無比的芯片,這可能是它遲遲沒有面世的原因。 Power9 現(xiàn)在采用格羅方德的 14 納米制程制造。它可能是格羅方德試圖在其 14 納米節(jié)點(diǎn)工藝上制造的最大的芯片,所以,如果產(chǎn)能和良率達(dá)不到 IBM 的預(yù)期,我一點(diǎn)都不會(huì)感到驚訝。同樣影響產(chǎn)能和良率的一個(gè)因素是,Power9 是一顆龐大而且復(fù)雜的高性能芯片。
英偉達(dá) Volta GPU 將成為 Summit 和 Sierra 的主力計(jì)算單元
Summit 和 Sierra 都將使用相似的搭載雙 Power9 處理器的 IBM HPC 計(jì)算機(jī),它們兩個(gè)的主要區(qū)別在于 Sierra 每個(gè)節(jié)點(diǎn)只有四個(gè) Tesla V100 GPU,而 Summit 每個(gè)節(jié)點(diǎn)包含六個(gè) Tesla V100 SXM2 GPU。雖然 GPU 數(shù)量更少,但是這種設(shè)計(jì)方式可以實(shí)現(xiàn) CPU 和 GPU 之間 150 GB/ 秒的 NVLink 2 通信速度,從而提高吞吐能力。
Tesla V100 中的每個(gè) GV100 GPU 都比 Power9 更加龐大,正是因?yàn)槊總€(gè) V100 都需要消耗 300 瓦的功率,才使用了昂貴的水冷解決方案。據(jù)預(yù)計(jì),整個(gè) Summit 的的功耗為 13 兆瓦,而擁有 4000-5000 個(gè)節(jié)點(diǎn)的 Sierra 的功耗為 11 兆瓦。就所有實(shí)際應(yīng)用而言,Summit 和 Sierra 的計(jì)算能力大小主要取決于 Tesla V100 GPU 的能力限制。
從美國這兩款超級計(jì)算機(jī)可以一窺英偉達(dá) V100 GPU 的市場機(jī)會(huì)。這兩個(gè)系統(tǒng)將使用超過 45,000 個(gè) V100 GPU,美國能源部的一位客戶表示,每顆 V100 GPU 的價(jià)格在 8000 美元左右,這兩臺(tái)超級計(jì)算機(jī)為 Tesla V100 貢獻(xiàn)的銷售額就超過了 3.6 億美元。
IBM 和英偉達(dá)很可能會(huì)成為全球超級計(jì)算領(lǐng)域的強(qiáng)勢存在,并持續(xù)受益于永無休止的打造更快超級計(jì)算機(jī)的軍備競賽。
?
更多有關(guān)超級計(jì)算機(jī)的資訊,歡迎訪問 與非網(wǎng)超級計(jì)算機(jī)專區(qū)
與非網(wǎng)編譯內(nèi)容,未經(jīng)許可,不得轉(zhuǎn)載!