加入星計劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴散
  • 作品版權(quán)保護
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 視訊介紹
    • 算力需求暴增,底層創(chuàng)新為云計算“續(xù)航”
    • 三步見證中國云計算發(fā)展
    • 軟硬協(xié)同設(shè)計應(yīng)“云”而生
    • 從“芯”出發(fā),為云而生
    • AI時代,軟硬件融合是更優(yōu)算力的歸途
  • 推薦器件
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

芯事訪談 | 阿里云張獻濤:算力需求暴增,底層創(chuàng)新為云計算“續(xù)航”

2023/08/09
4177
閱讀需 11 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

算力需求暴增,底層創(chuàng)新為云計算“續(xù)航”

十多年前,當(dāng)業(yè)界還在探討“云計算將給IT產(chǎn)業(yè)格局帶來什么變化”時,也許并沒有想到云計算會從當(dāng)初的抽象構(gòu)想成為全球產(chǎn)業(yè)變革的必由之路,并成長為重要的經(jīng)濟引擎。

時至今日,云計算推動的產(chǎn)業(yè)、商業(yè)和社會變革,已經(jīng)匯聚成承前啟后的關(guān)鍵力量,成長為數(shù)字經(jīng)濟的核心生產(chǎn)力,而面向ChatGPTAI應(yīng)用掀起的新革命,云計算的創(chuàng)新活力還將持續(xù)釋放,芯片作為重要的算力支撐也將發(fā)揮更大的價值。

本期《芯事》人物:張獻濤 —— 阿里云智能基礎(chǔ)產(chǎn)品部副總裁、阿里云彈性計算產(chǎn)品線總經(jīng)理

三步見證中國云計算發(fā)展

張獻濤在回顧起云計算發(fā)展的早期階段時調(diào)侃,“大約在2014年左右,當(dāng)時還處于傳統(tǒng)算力向云計算的轉(zhuǎn)移過程中,用戶多是中小站長為代表的個人開發(fā)者,負載可能就是一些中小企業(yè)的網(wǎng)站,不會有太多客戶關(guān)注高可用性、高性能等指標。”

時間來到2015年,新一輪移動互聯(lián)網(wǎng)爆發(fā)了,以互聯(lián)網(wǎng)公司為代表的技術(shù)型企業(yè),逐步推動傳統(tǒng)IT系統(tǒng)向基于云的IT系統(tǒng)轉(zhuǎn)移?!霸朴嬎愕牡诙l(fā)展階段拉開了大幕,對IaaS、SaaS高穩(wěn)定性、高性能的需求爆發(fā)了?!睆埆I濤說道,“也就是在這個時間節(jié)點,阿里云開始了戰(zhàn)略轉(zhuǎn)型,從傳統(tǒng)的服務(wù)中小站長用戶,面向移動互聯(lián)網(wǎng)場景的大信息流、高實時性、高性能、高并發(fā)的場景做出調(diào)整。正因如此,我們也承接了移動互聯(lián)網(wǎng)發(fā)展的一波紅利,迎來了中國云計算市場的爆發(fā)式增長?!?/p>

2020年以后,云計算進入了第三發(fā)展階段。張獻濤表示,“云計算開始縱深發(fā)展,上云的趨勢從消費互聯(lián)網(wǎng)向產(chǎn)業(yè)互聯(lián)網(wǎng)轉(zhuǎn)移,以產(chǎn)業(yè)客戶為代表的傳統(tǒng)企業(yè)上云的訴求越來越明顯?!?/p>

這對云計算其實提出了較大的挑戰(zhàn),因為需要保障客戶業(yè)務(wù)在連續(xù)、不間斷的情況下,能夠遷移到云的架構(gòu)。也正是在這個關(guān)鍵節(jié)點,阿里云開始了包括計算架構(gòu)、處理器、存儲等核心技術(shù)的創(chuàng)新變革。

軟硬協(xié)同設(shè)計應(yīng)“云”而生

在傳統(tǒng)IT時代,軟件硬件之間的依存程度并不高,可以分離演進,并行發(fā)展。但是進入云計算時代,軟硬件分離迭代的模式逐步顯現(xiàn)出局限性。應(yīng)用變得越來越復(fù)雜,算法、軟件和硬件的隔閡,已經(jīng)無法滿足在超大規(guī)模計算場景下提升IT計算效率、降低計算成本的訴求。如何最大化發(fā)揮“云”的價值,實現(xiàn)應(yīng)用快速上線且高效運行成為發(fā)展的關(guān)鍵。

“其實這也提供了一個機會,如果你對硬件、系統(tǒng)軟件、中間件等都掌握的話,你就可以很好地進行軟硬件協(xié)同設(shè)計,這是云計算時代一種新的技術(shù)紅利?!睆埆I濤表示,“我們當(dāng)時就在深入思考,既然硬件系統(tǒng)、軟件系統(tǒng)都是自研,下一步我們?nèi)绾螐能浖x硬件、定義芯片的視角,來做軟硬件協(xié)同的設(shè)計?”

當(dāng)時,傳統(tǒng)的虛擬化技術(shù)應(yīng)用到云計算過程中,其實存在非常多問題,比如算力損耗等,而這通常意味著計算成本可能會隨之增加。張獻濤談到,“所以在當(dāng)時的時間點上,我們首先需要通過軟硬件協(xié)同設(shè)計,解決傳統(tǒng)虛擬化技術(shù)帶來的這些問題。不過這一挑戰(zhàn)非常大,因為現(xiàn)有芯片無法滿足這些需求,我們幾乎評估了業(yè)界的所有芯片后,決定重新設(shè)計芯片、設(shè)計硬件、設(shè)計服務(wù)器的計算架構(gòu),并且對整個系統(tǒng)軟件棧進行重構(gòu),這是一個浩大的工程?!?/p>

后來的事實證明,阿里云當(dāng)時的這一決定極具前瞻性,使它既享受了軟硬件協(xié)同設(shè)計所實現(xiàn)的技術(shù)紅利,同時也給云計算客戶帶來更多收益,比如更低的成本、更優(yōu)質(zhì)的算力服務(wù)等。根據(jù)IDC數(shù)據(jù),阿里云數(shù)年來穩(wěn)居公有云市場排名第一的位置,并領(lǐng)跑金融云、視頻云等領(lǐng)域。

從“芯”出發(fā),為云而生

近年來,跨界造芯成為科技界的一大趨勢,不論是云計算大廠、AI算法公司或是車企,對于芯片的關(guān)注度越來越高。在這些跨入芯片圈的企業(yè)中,阿里巴巴旗下的平頭哥可以說是國內(nèi)起步最早的企業(yè)之一,一個核心的研發(fā)方向就是數(shù)據(jù)中心芯片。

成立于2018年的平頭哥,正處于云計算的拐點之上。

還記得2017年左右,阿里云的廣告語“上云就上阿里云”,雄踞國內(nèi)各大機場。短短一句話,傳遞了云計算當(dāng)時正在進行的變革和創(chuàng)新——它不再是互聯(lián)網(wǎng)企業(yè)的特有應(yīng)用,而是逐漸蔓延到傳統(tǒng)領(lǐng)域,向千行百業(yè)的企業(yè)發(fā)出“上云”邀請。一個趨勢已經(jīng)顯現(xiàn)——云計算將擴展到大數(shù)據(jù)、AI、物聯(lián)網(wǎng)等領(lǐng)域,共同成為傳統(tǒng)企業(yè)進行數(shù)字化轉(zhuǎn)型、我國發(fā)展數(shù)字經(jīng)濟必不可少的基礎(chǔ)支撐。

而這一切,都在倒逼底層技術(shù)加速升級。對于當(dāng)時的云計算巨頭來說,頭等大事就是如何滿足企業(yè)多種多樣的差異化需求?如何提供更具性價比的云服務(wù)?一方面是看得見的巨大藍海,一方面是對性能效率最大化的迫切需求——在這些推動因素下,自研芯片就成了一種自然而然的選擇。

倚天710是阿里巴巴第一顆為云而生的CPU芯片,由平頭哥半導(dǎo)體自研,設(shè)計核心在于適配阿里云大規(guī)模、多線程、高并發(fā)的業(yè)務(wù)特點。倚天710采用Armv9架構(gòu),擁有128個核心、主頻2.75GHz。通過將芯片設(shè)計與云場景的獨特需求相結(jié)合,倚天710最終實現(xiàn)了性能和能效比的雙重突破:性能超過當(dāng)時的業(yè)界標桿20%,能效比提升50%以上。倚天710發(fā)布后,2021年天貓“雙11”核心交易系統(tǒng)平滑遷移至倚天實例,算力性價比提30%。

隨著部署規(guī)模的不斷擴大,自研芯片的種種優(yōu)勢被不斷放大,不僅有助于打造穩(wěn)定、響應(yīng)快、能快速擴展的計算基礎(chǔ)設(shè)施,更便于云廠商在每個業(yè)務(wù)流程中做到效率與成本的最優(yōu)化,同時,還可以做到硬件和軟件并行開發(fā),這意味著能夠跨越傳統(tǒng)設(shè)計界限、創(chuàng)新速度更快。

“我們發(fā)現(xiàn)一些客戶對倚天芯片的擁抱程度其實是比較高的,尤其是互聯(lián)網(wǎng)客戶,因為不需要他們進行太多的業(yè)務(wù)架構(gòu)或代碼層面的改動,就能獲得更強的性能優(yōu)勢。此外,阿里云倚天實例在視頻編解碼業(yè)務(wù)場景中,性價比提升超過80%,在密集型計算業(yè)務(wù)場景中,性價比提升50%以上?!睆埆I濤表示,“這樣的客戶越來越多,也更加堅定了我們與平頭哥半導(dǎo)體一起在自研芯片這條路上繼續(xù)往前走的決心?!?/p>

阿里云倚天ECS的用戶中,北京科學(xué)智能研究院在使用密度泛函數(shù)理論軟件時,性價比提升70%;匯量科技廣告推理業(yè)務(wù)使用倚天710云實例,性能和網(wǎng)絡(luò)帶寬雙雙提升,性價比提升40% 以上。

談及對云原生系統(tǒng)中未來芯片的構(gòu)想,張獻濤表示,“我們還是希望能夠加入更多的云原生元素,與平頭哥半導(dǎo)體繼續(xù)緊密合作。此外,還有對新的總線比如UCIe、CXL的支持,從而能夠和CPU的計算架構(gòu)進行更為深度的融合,更好地發(fā)揮軟件的協(xié)同效應(yīng)?!?/p>

AI時代,軟硬件融合是更優(yōu)算力的歸途

在生成式AI掀起的巨大聲浪中,大模型對計算能力提出更高要求的同時,也給云計算帶來了新的應(yīng)用場景。隨著大模型應(yīng)用逐漸深入到千行百業(yè),未來,每家企業(yè)都可以是“AI大模型企業(yè)”。大模型時代需要什么樣的云服務(wù)?如何進一步降低用戶上云門檻?

顯然,成本首先是一筆要算的賬,現(xiàn)階段大模型的算力成本非常高昂。對此,張獻濤表示,還是需要提升算力效率,通過軟硬件的充分融合,通過自定義的芯片去加速算力提升,比如和平頭哥進行更加深度的合作,能夠讓這個領(lǐng)域所需要的強大AI算力,通過軟硬件的深度協(xié)同變得更高效、成本更低。

“無論是在初代智能時代,還是這些年AI的發(fā)展,其實都需要深度的軟硬件融合技術(shù)帶來提升。而軟硬件融合的本質(zhì)更多還是軟件定義硬件的一種新型模式,通過這種模式,軟件和硬件之間的協(xié)同程度更高了,能夠讓軟件的效率充分發(fā)揮出來,最終可以把整體計算效率提升起來”,張獻濤談到。

面臨AI浪潮的來襲,云計算不僅需要通過算力普惠推動企業(yè)的數(shù)字化轉(zhuǎn)型,同時,也肩負著助力AI更普及、為千行百業(yè)智能化升級提供核心動力的重任。在云計算和AI深度融合驅(qū)動的新一輪變革中,云計算和AI大模型將共同成為新時代的基礎(chǔ)設(shè)施,而芯片將提供必不可少的底層支撐,讓算力更普惠、讓 AI 更普及。一個由算力撬動的智能時代---大幕已經(jīng)拉開。

推薦器件

更多器件
器件型號 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊 ECAD模型 風(fēng)險等級 參考價格 更多信息
DSPIC33EP512MU810-I/PT 1 Microchip Technology Inc 16-BIT, FLASH, 60 MHz, MICROCONTROLLER, PQFP100, 12 X 12 MM, 1 MM HEIGHT, LEAD FREE, PLASTIC, TQFP-100
$10.04 查看
ATXMEGA256A3-AU 1 Microchip Technology Inc IC MCU 8BIT 256KB FLASH 64TQFP

ECAD模型

下載ECAD模型
$11.92 查看
ATMEGA128A-MU 1 Atmel Corporation RISC Microcontroller, 8-Bit, FLASH, AVR RISC CPU, 16MHz, CMOS, 9 X 9 MM, 1 MM HEIGHT, 0.50 MM PITCH, GREEN, MO-220VMMD, QFN-64

ECAD模型

下載ECAD模型
$5.69 查看
平頭哥

平頭哥

平頭哥半導(dǎo)體有限公司于2018年9月宣布成立,是阿里巴巴集團的全資半導(dǎo)體芯片業(yè)務(wù)主體。平頭哥擁有端云一體全棧產(chǎn)品系列,涵蓋數(shù)據(jù)中心人工智能芯片、處理器IP授權(quán)等,實現(xiàn)芯片端到端設(shè)計鏈路全覆蓋。

平頭哥半導(dǎo)體有限公司于2018年9月宣布成立,是阿里巴巴集團的全資半導(dǎo)體芯片業(yè)務(wù)主體。平頭哥擁有端云一體全棧產(chǎn)品系列,涵蓋數(shù)據(jù)中心人工智能芯片、處理器IP授權(quán)等,實現(xiàn)芯片端到端設(shè)計鏈路全覆蓋。收起

查看更多

相關(guān)推薦

電子產(chǎn)業(yè)圖譜