日前,有媒體發(fā)布了《除了圓珠筆頭,中國還有哪些核心技術沒掌握?答案令人震驚……》一文,并在網絡上廣泛傳播。文章中介紹了很多中國在諸多科技領域的短板,說明了在精密儀器、數控機床等領域中國依然和國際頂尖水平有較大差距。但文章存在一些明顯的謬誤,比如介紹了幾項有關超算的內容,但這幾項技術卻并非中國還未掌握的核心技術。
日本在 CPU+GPU 異構式超算方面技術成果非常有限
《除了圓珠筆頭,中國還有哪些核心技術沒掌握?答案令人震驚……》一文中稱:
“cpu/gpu 異構式超算系統(tǒng)的提倡者兼此平臺程序軟件的先驅開發(fā)者,超級計算機界最高峰學術賞 sidney fernbach award 的新科得主——東京工業(yè)大學全球科學信息計算中心 prof.satoshi matsuoka;隨著后續(xù)軟體資源的快速配套和并行集群計算技術的加速發(fā)展,cpu/gpu 異構式超算已經成為整個 hpc 界的事實標準體系,從最早的 tsubame1.2 到連續(xù) green500 測試頭名的 tsubame-kfc,目前全球幾乎所有高性能超算系統(tǒng)都是此架構的支持者,matsuoka 博士也因此獲得了象征超級計算機領域個人最高榮譽的 sidney fernbach award”
拋開文章中非常拗口的表達方式不談,該文章中的內容很容易誤導讀者,以為日本在 cpu/gpu 異構式超算方面有很高的成就。那么,實際情況又是怎么樣呢?
CPU+GPU 異構式超算系統(tǒng)僅僅是異構式超算系統(tǒng)的一個選項,而日本 matsuoka 博士是 CPU+GPU 異構式超算系統(tǒng)的提倡者,而之后的完善和實現是全球眾多工程師、公司合力的結果,比如中國國防科大、美國英偉達公司等都參與其中。
就 CPU+GPU 異構式超算的技術成果來說,中國有天河 1A,美國有泰坦。相比之下,日本在 CPU+GPU 異構式超算方面卻沒有性能與泰坦相似的 CPU+GPU 異構式超算系統(tǒng),根本沒能建成哪怕一臺性能達到神威太湖之光十分之一的 cpu/gpu 異構式超算。即便是日本最新建的超算 Oakforest-PACS,也使用的是 Intel 的眾核加速器,而非美國英偉達公司的 GPGPU。
日本新超算 Oakforest-PACS
CPU+GPU 異構式超算并非高不可攀
異構計算要使用不同類型的處理器來處理不同類型的計算任務。常見的計算單元包括 CPU、GPGPU、GPDSP、ASIC、FPGA 和其它類型的眾核處理器等。采用異構計算架構的超算會使用至少 2 種類型的處理器,其中異構計算架構中通用 CPU 負責邏輯復雜的調度和串行任務,加速器負責并行度高的任務,實現計算加速。
具體來說,采用異構計算架構的超算在運算中既使用處理器,又使用 GPU 或眾核芯片等加速器。中國天河 2 號、美國泰坦都采用異構計算架構。
而根據使用的加速器不同,異構超算也有多種類型。
比如美國超算泰坦、中國的天河 1A,就是 CPU+GPGPU。
中國超算天河 2 號就是 CPU+眾核處理器。
中國天河 2A 超算則是 CPU+GPDSP。由于美國對中國四家超算中心禁售 Intel 至強 PHI 計算卡,升級之后的天河 2A 采用自主研發(fā)的矩陣 2000 來替代 Intel 的計算卡,在更換加速器之后,變成了 CPU+GPDSP,這是全球首創(chuàng)。
此外,也可以直接使用經過有著特殊設計的眾核芯片,比如神威太湖之光,這也是全球首創(chuàng),國外間諜對中國這款眾核芯片非常感興趣。原因就在于這款眾核芯片憑借設計理念的先進性,以落后美國 Intel 公司 2 代的制造工藝,實現了與美國 Intel 公司最先進計算卡相似的性能。
從中可以看出,CPU+GPU 異構體系只是異構超算體系的一個選項,而非什么高不可攀的黑科技。而且無論是中國天河 2A 的 CPU+GPDSP,還是神威太湖之光的眾核異構體系目前都是全球唯一,而且性能無與倫比。
文中“目前全球幾乎所有高性能超算系統(tǒng)都是此架構的支持者”不符合客觀事實
文章中稱:“cpu/gpu 異構式超算已經成為整個 hpc 界的事實標準體系”,“目前全球幾乎所有高性能超算系統(tǒng)都是此架構的支持者”。但這與客觀事實不相符。
舉例來說,如上圖所示:2016 年 TOP500 前 10 的超算依次為:
神威太湖之光,中國,性能 93P;
天河 2 號,中國,性能 33P;
泰坦,美國,性能 17P;
紅杉,美國,性能 17P;
科里,美國,性能 14P;
Oakforest-PACS,日本,13P;
京,日本,性能 10P;
代恩特峰,瑞士,性能 9P;
米拉,美國,性能 8P;
三一,美國,性能 8P。
在這當中,紅杉、米拉、三一、京都是屬于同構體系超算,壓根就不是異構體系超算,更遑論 cpu/gpu 異構式超算。
而天河 2 號、科里、Oakforest-PACS 采用的是 CPU+眾核加速器,雖然屬于異構超算體系,但并非 cpu+gpu 異構式超算。
神威太湖之光在技術上獨樹一幟,將管理核心與加速器合二為一,屬于眾核異構超算。
在全球性能最強的 10 臺超算中,只有泰坦和代恩特峰使用了英偉達的 GPGPU,屬于 cpu/gpu 異構式超算。
從中可以看出,“cpu/gpu 異構式超算已經成為整個 hpc 界的事實標準體系”,“目前全球幾乎所有高性能超算系統(tǒng)都是此架構的支持者”這種說法是站不住腳的。
過度鼓吹被淘汰技術并不可取
文章中稱:“NEC 喧布已開發(fā)完成最新型 SX 系列矢量超級計算機——SX-ACE 這臺采用 sun 架構的矢量超算雖然其總體運算能力(130TFLOPS)排不進世界前 5,但卻具備世界第一的單核性能(64GFLOPS)和世界第一的單核內存帶寬(64GB/s),并利用獨到的工業(yè)設計實現緊湊化與低耗能”。
首先要明確的是,日本比較推崇向量機,SX-ACE 其實是向量機,中國在幾十年前也曾經做過,比如已經有不少年月的國內首臺銀河億次機就是向量機。因而向量機對于中國來說并非什么沒有掌握的技術。
現在中國不做向量機,并非沒有掌握該技術而做不了,而是完全是不屑于做。因為這種向量機完全早過時了,完全是被淘汰的設計,性能低就不說了,還有成本高,應用范圍窄的缺點,更要命的是可擴展性也不好。
對于日本的 SX-ACE,國內從事高性能計算機的資深工程師表示:這機器現在大概已不存在了吧 ..... 我說大概不存在,主要是目前很少有人再去推崇向量機;第二就是這臺機器的性能參數并不突出,不值得耗費時間精力去關注。
最后要補充的是 SX-ACE 很多技術其實源自美國 SUN 公司,比如其 SPARC 處理器,就是 SUN 公司的遺產。
中國在超算技術上領先日本
在 2011 年,日本超算京曾經位列 TOP500 第一。但由于日本經濟在廣場協議之后一直保持在低迷的狀態(tài),加上超算本來就屬于偏向國家工程的項目,相對較少的建造量和昂貴的價格都很難讓私人公司通過超算獲取高額利潤,在研發(fā)成本過于高昂的情況下,使得日本 NEC、日立等大公司先后退出超算研發(fā)領域,唯有富士通還在苦苦支撐。
而在超算研發(fā)經費的撥付上,日本政府相當吝嗇。而且還曾發(fā)生過這樣一件事——數位日本科學家聯名向政府申請超算研發(fā)經費,結果遭到日本政客反問:“當老二有什么不好?”
也正是因此,由于長時間缺乏經費,導致日本在超算技術上缺乏大型工程的磨礪。對于此,日本官方也是心知肚明。在 2016 年,日本文部科學省發(fā)表了后續(xù)基本設計方針:“在發(fā)展方針中,日本文部科學省不再追求世界第一的計算速度,而是將目標由加快計算速度轉向了加強節(jié)能及便捷功能”。但從曾經追求計算性能最強超算,到如今的追求最節(jié)能超算,想必日本從事超算建設的工程師們心中除了無奈只有苦笑吧。
在美國鹽湖城 SC16 全球超算大會期間召開的第 14 屆 HPC Connection Workshop 中外超算高峰論壇(HPCC)上,日本理化所 Mitsuhisa Sato 透露了日本發(fā)展 E 級超算的“旗艦 2020 計劃”,宣布將在 2017 年 4 月投入運營 Post K 超級計算機,其系統(tǒng)峰值性能約為 25P, 1000P 超算的升級計劃被排到了 2020 年。
不過,技術發(fā)展有其規(guī)律,是一步一個腳印迭代演進的,大躍進式一口吃成一個胖子的做法并不可取。而且日本的超算建設十有八九無法按時完成,舉例來說,如今已將近 2017 年 4 月份了,日本理化所計劃中投入運營的 25P 超算尚無音訊。何況日本最新的 Oakforest-PACS 也只有 13P,從 13P 迅速跨越到 1000P,這中間的技術擴跨度實在是太大,從處理器到互聯網絡都有質的飛越,如果不謀求從美國獲取技術,這對于日本來說未必不是一個挑戰(zhàn)。
目前,中國三家單位同時開展了 1000P 超算的原型機研制,并計劃在 2020 年建成 1000P 超算。考慮到中國在過去幾年中在超算上技術成果斐然,先后研制出曙光 6000、天河 1 號、天河 2 號、神威太湖之光等性能優(yōu)異的超算,中國很有可能領先日本完成 1000P 超算的建設。
更多最新行業(yè)資訊,歡迎點擊與非網《今日大事要聞》!