6月13日,阿里云智能總裁張建鋒在峰會上正式發(fā)布CIPU(Cloud infrastructure Processing Units),這是為新型云數(shù)據(jù)中心設(shè)計的專用處理器,未來將替代CPU成為云計算的管控和加速中心。
在這個全新體系架構(gòu)下,CIPU向下對數(shù)據(jù)中心的計算、存儲、網(wǎng)絡資源快速云化并進行硬件加速,向上接入飛天云操作系統(tǒng),將全球數(shù)百萬臺服務器連成一臺超級計算機。
?
阿里云智能總裁張建鋒發(fā)布CIPU
例如,CIPU與計算結(jié)合,快速接入不同類型資源的服務器,帶來算力的“0”損耗,以及硬件級安全的加固隔離;CIPU與存儲結(jié)合,對存算分離架構(gòu)的塊存儲接入進行硬件加速,云盤存儲IOPS最高可達300萬,長尾時延降低50%;CIPU與網(wǎng)絡結(jié)合,可對高帶寬物理網(wǎng)絡進行硬件加速,構(gòu)建大規(guī)模彈性RDMA高性能網(wǎng)絡,時延最低可達5us。
CIPU架構(gòu)示意圖
基于CIPU和飛天的新一代云計算架構(gòu)體系,在通用計算、大數(shù)據(jù)、人工智能等核心場景的計算測試中展現(xiàn)了優(yōu)越的性能。在通用分布式計算領(lǐng)域,Redis性能提升了68%、MySQL提升了60%,Nginx提升了30%;高吞吐類的互聯(lián)網(wǎng)業(yè)務上云之后,比自建物理機的集群吞吐量提升了30%,業(yè)務高峰期延遲下降了90%;在大數(shù)據(jù)和AI等計算與數(shù)據(jù)雙密集場景下,相比傳統(tǒng)的TCP網(wǎng)絡,彈性RDMA高性能網(wǎng)絡的吞吐能力提升30%以上;云原生方面,容器啟動速度快了350%,在Serverless 場景下6秒可拉起3000個彈性容器實例。
CIPU特性簡介
為什么要有CIPU?張建鋒認為,過去十多年,云計算技術(shù)經(jīng)歷了兩個發(fā)展階段:第一階段是分布式和虛擬化技術(shù)替代了大型機,滿足了當時企業(yè)所需的算力規(guī)模;第二階段出現(xiàn)了資源池化技術(shù),以阿里巴巴為例,通過計算存儲分離架構(gòu),將計算、存儲、網(wǎng)絡資源分別池化,突破了規(guī)模和穩(wěn)定性的瓶頸,提供了超大規(guī)模的云計算服務。
但隨著數(shù)據(jù)密集型計算場景的普及,用戶對低時延、高帶寬的需求也越來越高,傳統(tǒng)以CPU為中心的計算體系架構(gòu)無法適應這一趨勢。為了解決這一問題,阿里云相關(guān)研發(fā)團隊早在2015年就開始技術(shù)攻關(guān),并于2017年推出業(yè)內(nèi)首款虛擬化損耗為零的神龍云服務器。經(jīng)過多年自研迭代,神龍、彈性RDMA等核心技術(shù)不斷深入垂直整合,演進出以CIPU為中心的全新架構(gòu)形態(tài),云計算開始進入第三階段。
阿里云還不斷夯實技術(shù)底座,建立了自研的芯片、服務器、飛天操作系統(tǒng)等軟硬一體的基礎(chǔ)設(shè)施。這些基礎(chǔ)設(shè)施有力支撐了阿里云產(chǎn)品的四大核心:神龍計算、盤古存儲、洛神網(wǎng)絡和安全內(nèi)核。在國際權(quán)威機構(gòu)Gartner發(fā)布的年度報告里,阿里云獲得計算、存儲、網(wǎng)絡、安全4項單項最高分以及IaaS整體基礎(chǔ)設(shè)施能力的全球最高分。