水稻有4萬(wàn)多個(gè)基因,如何破解其基因密碼,讓傳統(tǒng)育種方式轉(zhuǎn)型升級(jí)?浩瀚宇宙中的快速射電暴,持續(xù)時(shí)間僅有幾毫秒,如何借助數(shù)據(jù)挖掘揭開其起源的奧秘?……在浙江杭州的之江實(shí)驗(yàn)室內(nèi),這些國(guó)家重大科研項(xiàng)目瞄準(zhǔn)的“世紀(jì)難題”,正在被智能計(jì)算“數(shù)字反應(yīng)堆”逐個(gè)破解。
之江實(shí)驗(yàn)室是浙江競(jìng)逐智能計(jì)算賽道、打造區(qū)域競(jìng)爭(zhēng)優(yōu)勢(shì)的一個(gè)縮影。4月12日,記者隨“算力中國(guó)行”大型調(diào)研采訪團(tuán)走進(jìn)長(zhǎng)三角中心城市杭州,看到一條獨(dú)具特色的智算“浙江路徑”已經(jīng)初露雛形。
浙江省經(jīng)濟(jì)和信息化廳相關(guān)負(fù)責(zé)人告訴記者:“智算產(chǎn)業(yè)已成為浙江省著力打造的標(biāo)志性產(chǎn)業(yè),也是省里正在重點(diǎn)推進(jìn)的‘415X’產(chǎn)業(yè)集群之一?!痹谶@個(gè)良渚文化的發(fā)源地,從網(wǎng)絡(luò)、芯片、操作系統(tǒng)到整機(jī)、應(yīng)用的智算產(chǎn)業(yè)鏈上下游玩家正在匯集,形成協(xié)同發(fā)展的創(chuàng)新產(chǎn)業(yè)生態(tài)。
之江實(shí)驗(yàn)室的“數(shù)字反應(yīng)堆”
2022年3月,我國(guó)科研團(tuán)隊(duì)基于“中國(guó)天眼”的觀測(cè)證據(jù),在快速射電暴起源研究中取得重要成果。研究團(tuán)隊(duì)夜以繼日地巡視著浩瀚宇宙,每天產(chǎn)生的數(shù)據(jù)高達(dá)300TB,足以裝滿300臺(tái)個(gè)人電腦。
之江實(shí)驗(yàn)室多模光纖顯微內(nèi)窺鏡展臺(tái)
以前,研究人員面對(duì)海量數(shù)據(jù)就像“大海撈針”。如今,基于異構(gòu)資源計(jì)算運(yùn)行的之江實(shí)驗(yàn)室“數(shù)字反應(yīng)堆”展開智能計(jì)算,讓深度挖掘快速射電暴數(shù)據(jù)成為可能。不止在天文領(lǐng)域,新材料、生物醫(yī)藥等越來(lái)越多的領(lǐng)域,都離不開智能算力的支撐。
“調(diào)研發(fā)現(xiàn),我國(guó)算力的利用率還不足30%,尚未被充分利用開發(fā)。其中一個(gè)重要原因,是算力資源尚不能針對(duì)性解決行業(yè)研究領(lǐng)域的問題,且算力資源分散分布,集中調(diào)用起來(lái)十分困難。”之江實(shí)驗(yàn)室主任、智能計(jì)算數(shù)字反應(yīng)堆總設(shè)計(jì)師,浙江大學(xué)黨委副書記朱世強(qiáng)告訴《中國(guó)電子報(bào)》記者。
基于這一考慮,之江實(shí)驗(yàn)室聯(lián)合10余家頂級(jí)創(chuàng)新機(jī)構(gòu),于2021年10月正式啟動(dòng)了智能計(jì)算“數(shù)字反應(yīng)堆”這一重大科學(xué)裝置,以算力為“燃料”,在“數(shù)字反應(yīng)堆”引擎推動(dòng)下,讓異構(gòu)算力資源聚合和調(diào)度成為可能,為不同垂直行業(yè)帶來(lái)“裂變”。
為提供充足的算力,之江實(shí)驗(yàn)室落成了目前國(guó)內(nèi)同類科研機(jī)構(gòu)中規(guī)模最大、等級(jí)最高的算力中心之一?!皵?shù)字反應(yīng)堆”聚合起智能超算、智算集群,類腦計(jì)算機(jī)、圖計(jì)算機(jī)等算力資源,協(xié)同整合算力可達(dá)10EFlops(每秒1000京次浮點(diǎn)運(yùn)算次數(shù))。
“數(shù)字反應(yīng)堆”已經(jīng)開枝散葉,滿足了育種、制藥、材料、基因等多個(gè)垂直行業(yè)創(chuàng)新研發(fā)的核心需求。以材料科技領(lǐng)域?yàn)槔?,傳統(tǒng)研發(fā)模式是把不同元素原料混起來(lái),一點(diǎn)點(diǎn)調(diào)整,反復(fù)試錯(cuò)。在數(shù)字反應(yīng)堆打造的新平臺(tái)上,從篩選到建模再到設(shè)計(jì)驗(yàn)證都有人工智能為其助力。
智能計(jì)算何以擔(dān)此大任?之江實(shí)驗(yàn)室智能計(jì)算數(shù)字反應(yīng)堆總架構(gòu)師潘愛民告訴《中國(guó)電子報(bào)》記者,智能計(jì)算不是超級(jí)計(jì)算、云計(jì)算的替代品,也不是現(xiàn)有計(jì)算的簡(jiǎn)單集成品,而是根據(jù)任務(wù)所需,以最佳方式和最恰當(dāng)?shù)挠?jì)算方法,解決實(shí)際問題的一種計(jì)算形態(tài)。
潘愛民透露,之江實(shí)驗(yàn)室建設(shè)“數(shù)字反應(yīng)堆”還有更深層的原因。一方面在于降低項(xiàng)目中復(fù)雜任務(wù)的計(jì)算門檻。以不同技術(shù)實(shí)現(xiàn)的計(jì)算資源,往往具有不同的系統(tǒng)架構(gòu)或指令集,用戶有時(shí)還必須專門編寫程序。有了該系統(tǒng)的統(tǒng)籌協(xié)調(diào),用戶不必再為重復(fù)開發(fā)、軟硬件不兼容等撓頭。數(shù)字反應(yīng)堆還可為科研人員提供“零代碼一鍵部署”服務(wù),幫助他們以最少的手動(dòng)編碼開發(fā)出功能強(qiáng)大的應(yīng)用。
另一方面是服務(wù)于我國(guó)算力產(chǎn)業(yè)的發(fā)展特點(diǎn)。不同于ChatGPT背后有強(qiáng)大產(chǎn)業(yè)鏈的支撐,我國(guó)在大模型、數(shù)據(jù)和智算芯片等環(huán)節(jié)還沒那么完善。在這樣的現(xiàn)實(shí)情況下,提供這樣一套兼容不同型號(hào)產(chǎn)品、不同體系架構(gòu)的算力基礎(chǔ)設(shè)施就顯得愈發(fā)重要。
浙江智算產(chǎn)業(yè)呈“鏈?zhǔn)健卑l(fā)展態(tài)勢(shì)
每個(gè)地區(qū)都有自己的競(jìng)爭(zhēng)優(yōu)勢(shì)。在浙江,智能計(jì)算就是區(qū)域競(jìng)爭(zhēng)的關(guān)鍵變量之一。
根據(jù)國(guó)家信息中心發(fā)布的《智能計(jì)算中心創(chuàng)新發(fā)展指南》,“十四五”期間,在智算中心實(shí)現(xiàn)80%應(yīng)用水平的情況下,城市對(duì)智算中心的投資,可帶動(dòng)人工智能核心產(chǎn)業(yè)增長(zhǎng)約2.9-3.4倍、帶動(dòng)相關(guān)產(chǎn)業(yè)增長(zhǎng)約36-42倍。
杭鋼云計(jì)算數(shù)據(jù)中心智慧化應(yīng)用
華為公司前期調(diào)研發(fā)現(xiàn),浙江省AI算力需求旺盛,有超過80%的企業(yè)、科研單位迫切需要外部專業(yè)力量在智能應(yīng)用算力部署、性能調(diào)優(yōu)、算法調(diào)優(yōu)和數(shù)據(jù)標(biāo)注予以支持,本地智能化算力服務(wù)供給還不充足。
浙江省經(jīng)濟(jì)和信息化廳相關(guān)負(fù)責(zé)人告訴記者,近年來(lái),浙江省著力提升高性能算力占比,提升算力算效水平。推進(jìn)數(shù)據(jù)中心算力供應(yīng)多元化,支撐各類智能應(yīng)用。截至今年2月底,浙江省已建數(shù)據(jù)中心150多個(gè),在杭州、嘉興、湖州、金華、溫州等地皆有布局。到“十四五”末期,浙江省算力規(guī)模將達(dá)到23.66EFlops(每秒2366京次浮點(diǎn)運(yùn)算次數(shù))。
從網(wǎng)絡(luò)、芯片、操作系統(tǒng)到整機(jī)再到應(yīng)用,浙江省正在聚合整條產(chǎn)業(yè)鏈上下游的玩家,成為我國(guó)智算產(chǎn)業(yè)“版圖”上舉足輕重的一部分。
經(jīng)過幾年的積累,中國(guó)(杭州)算力小鎮(zhèn)、杭州智能計(jì)算示范中心、中國(guó)(浙江)智能計(jì)算產(chǎn)業(yè)創(chuàng)新園等一批重要算力設(shè)施園區(qū)平臺(tái)載體相繼揭牌、投運(yùn);寧波人工智能超算中心、阿里仁和液冷數(shù)據(jù)中心智算資源(部分投產(chǎn),總規(guī)劃250P)等一批先進(jìn)算力設(shè)施建設(shè)如火如荼……浙江已經(jīng)形成電信運(yùn)營(yíng)商、互聯(lián)網(wǎng)企業(yè)、金融公司、大型生產(chǎn)企業(yè)及政府事業(yè)單位、研究院所、國(guó)有企業(yè)“攜手并進(jìn)”的發(fā)展態(tài)勢(shì),同時(shí)帶動(dòng)全省智能算力基礎(chǔ)設(shè)施產(chǎn)業(yè)生態(tài)不斷“外溢”。
近日,浙江移動(dòng)的算力網(wǎng)絡(luò)與杭州人工智能計(jì)算中心實(shí)現(xiàn)AI算力并網(wǎng),完成了杭州智團(tuán)信息技術(shù)有限公司的宮頸細(xì)胞學(xué)病理AI模型訓(xùn)練任務(wù)的調(diào)度。并網(wǎng)成功后,推理時(shí)間從之前的2分鐘降低到1.2秒,模型訓(xùn)練時(shí)間從168小時(shí)降低到120小時(shí)。杭州聯(lián)匯科技、杭州它人機(jī)器人等企業(yè)也正在使用杭州人工智能計(jì)算中心的AI服務(wù),進(jìn)行流程的對(duì)接及模型的調(diào)試優(yōu)化。
浙江省經(jīng)信廳相關(guān)負(fù)責(zé)人告訴記者,未來(lái)浙江省將推動(dòng)一批低算力的數(shù)據(jù)中心向智算中心轉(zhuǎn)型升級(jí),推動(dòng)CPU、GPU 等異構(gòu)算力部署,提高數(shù)據(jù)中心算力算效水平和供應(yīng)能力,為各類應(yīng)用提供高質(zhì)量的AI算力服務(wù),豐富算力應(yīng)用場(chǎng)景,形成多層次算力設(shè)施體系。
據(jù)了解,目前我國(guó)的智算中心采用了高標(biāo)準(zhǔn)建設(shè),100P算力是起步目標(biāo),該算力大約相當(dāng)于5萬(wàn)臺(tái)高性能電腦。這也意味著,智算中心建設(shè)對(duì)軟硬件的要求更高。
華為公司依托杭州人工智能計(jì)算中心,將鯤鵬/昇騰生態(tài)等根技術(shù)交付給本地產(chǎn)業(yè)伙伴,打造差異化產(chǎn)品面對(duì)細(xì)分市場(chǎng),讓自研產(chǎn)品向全國(guó)延展;面對(duì)未來(lái)大量的異構(gòu)算力需求,新華三為行業(yè)打造了智算中心解決方案,利用“一芯多云”構(gòu)建智算中心基礎(chǔ)環(huán)境,覆蓋了自動(dòng)駕駛、智能駕倉(cāng)、小分子研發(fā)、蛋白預(yù)測(cè)、智能客服等細(xì)分行業(yè)場(chǎng)景。
“下一步的重點(diǎn)工作之一,是要推動(dòng)算網(wǎng)產(chǎn)業(yè)生態(tài)繁榮。強(qiáng)化‘鏈?zhǔn)剿季S’,形成龍頭企業(yè)帶動(dòng)、大中小企業(yè)協(xié)作、打造安全穩(wěn)定、自主可控、開放共贏的算網(wǎng)產(chǎn)業(yè)繁榮新生態(tài)。”浙江省經(jīng)信廳相關(guān)負(fù)責(zé)人說(shuō)。
東西部地區(qū)應(yīng)加強(qiáng)場(chǎng)景挖掘和合作研究
走進(jìn)阿里云仁和數(shù)據(jù)中心的液冷機(jī)房,耳邊沒有空調(diào)運(yùn)行的“嗡嗡”聲,一座座臥式機(jī)柜整齊排列,一排排服務(wù)器靜靜躺在絕緣冷卻液里。這里是全國(guó)規(guī)模最大的單相浸沒液冷集群,全程用于散熱的能耗幾乎為零,實(shí)現(xiàn)了數(shù)據(jù)中心100%無(wú)機(jī)械制冷,數(shù)據(jù)中心PUE(電能利用效率)可低至1.09。
“數(shù)據(jù)中心應(yīng)用液冷技術(shù)是大勢(shì)所趨?!卑⒗镌苹A(chǔ)設(shè)施IDC研發(fā)事業(yè)部總經(jīng)理王朝陽(yáng)告訴記者,我國(guó)數(shù)據(jù)中心年用電量約占全社會(huì)用電的2%,隨著算力爆發(fā)式增長(zhǎng),所需的服務(wù)器數(shù)量也會(huì)相應(yīng)增加,這就要求業(yè)界采用更高效節(jié)能的散熱技術(shù)。
“相較于容易受到溫濕度、灰塵影響的傳統(tǒng)風(fēng)冷散熱,浸沒式液冷散熱不僅故障率低、不受氣候和地域閑置,尤其適合部署在極寒或溫濕度較高的南方。”據(jù)王朝陽(yáng)介紹,浸沒式液冷數(shù)據(jù)中心還有另一大優(yōu)勢(shì),即單機(jī)柜可部署功率密度15—100kW,這意味著相同電力容量,液冷數(shù)據(jù)中心可以多部署約50%的服務(wù)器,這也能更好地適應(yīng)AI訓(xùn)練等大算力業(yè)務(wù)場(chǎng)景。
為迎接智能計(jì)算時(shí)代的到來(lái)、提升算效,除了數(shù)據(jù)中心要實(shí)現(xiàn)技術(shù)創(chuàng)新,綜合提升規(guī)模、算力、智能化外,還要在算力跨域調(diào)度、樞紐集群互聯(lián)模式、算力與需求高效匹配等方面進(jìn)行優(yōu)化。
“目前來(lái)看,現(xiàn)有算力樞紐集群間多采用點(diǎn)對(duì)點(diǎn)的直連網(wǎng)絡(luò)模式,網(wǎng)絡(luò)相對(duì)封閉,資源利用率低、建設(shè)投資大、普惠程度低,不利于算力產(chǎn)業(yè)規(guī)模化發(fā)展?!庇粑娘w建議,基于國(guó)家新型互聯(lián)網(wǎng)交換中心的扁平化架構(gòu),依托區(qū)域內(nèi)匯聚、樞紐內(nèi)協(xié)同和樞紐間貫通,開放化共享算力調(diào)度專網(wǎng),探索跨行業(yè)、跨部門、跨系統(tǒng)聯(lián)動(dòng)的算力調(diào)度場(chǎng)景應(yīng)用。強(qiáng)化算力資源高效供給。
智能算力時(shí)代,算力與需求和應(yīng)用要高效匹配。在浙江電信云網(wǎng)發(fā)展部副總經(jīng)理曹懿軍看來(lái),當(dāng)前算力產(chǎn)業(yè)跨域調(diào)度的需求場(chǎng)景不夠明確,盈利模式尚未明確,不少企業(yè)僅僅停留在基礎(chǔ)設(shè)施建設(shè)階段。應(yīng)當(dāng)針對(duì)綜合性、復(fù)雜性的工程項(xiàng)目,要鼓勵(lì)聯(lián)營(yíng)等創(chuàng)新組織模式;鼓勵(lì)采用“算力券”等創(chuàng)新業(yè)務(wù)模式,探索以此為核心的算力中心運(yùn)營(yíng)成本統(tǒng)籌結(jié)算分擔(dān)機(jī)制。他認(rèn)為,東西部政府應(yīng)加強(qiáng)場(chǎng)景挖掘和合作研究,共同鼓勵(lì)“東數(shù)西算”“東數(shù)西存”“東數(shù)西渲”等重點(diǎn)場(chǎng)景規(guī)?;趸?。
“存儲(chǔ)設(shè)施是數(shù)據(jù)永久性的‘家’,存儲(chǔ)設(shè)備及成套系統(tǒng)是支撐新型數(shù)據(jù)基礎(chǔ)設(shè)施存儲(chǔ)能力建設(shè)的直接影響因素?!拔覈?guó)在數(shù)據(jù)基礎(chǔ)設(shè)施布局方面,存在‘重計(jì)算、輕存儲(chǔ)’的問題,根據(jù)不完全統(tǒng)計(jì),目前我國(guó)存算比例為1:3.3,但歐美發(fā)達(dá)國(guó)家這一比例為1:1.5?!焙贾莺晟伎萍脊煞萦邢薰究?a class="article-link" target="_blank" href="/tag/%E5%B7%A5%E7%A8%8B%E5%B8%88/">工程師單東來(lái)表示,建議出臺(tái)相關(guān)扶持政策加快存儲(chǔ)上下游產(chǎn)業(yè)鏈的全面發(fā)展,除了核心的存儲(chǔ)器、存儲(chǔ)芯片等,還應(yīng)更多關(guān)注存儲(chǔ)系統(tǒng)集成等產(chǎn)業(yè)中下游緩解,進(jìn)而有效提升新型數(shù)據(jù)基礎(chǔ)設(shè)施的存儲(chǔ)能力。
作者丨齊旭
編輯丨劉晶
美編丨馬利亞
監(jiān)制丨趙晨