加入星計劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴散
  • 作品版權(quán)保護
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
    • 算力饑渴有望帶動云服務(wù)復(fù)興
    • 傳統(tǒng)云生態(tài)過渡到新型云生態(tài)
    • MaaS成趨勢,大模型服務(wù)是主流
    • 云服務(wù)提供商積極發(fā)力
    • 結(jié)尾:
  • 推薦器件
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

深度丨長在云上的大模型,也終將改變云計算的格局

01/04 11:00
2848
閱讀需 8 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

作者 | 方文三

云計算產(chǎn)業(yè)正面臨一場由大模型技術(shù)引領(lǐng)的變革,背后的驅(qū)動力主要有兩個方面:首先,AI算力和AI軟件的需求增長速度遠遠超過通用算力和傳統(tǒng)軟件;其次,大模型的應(yīng)用有助于降低軟件和項目交付的成本。

算力饑渴有望帶動云服務(wù)復(fù)興

與前兩年的繁榮相比,近兩年來云計算行業(yè)面臨困境,增長乏力。

在大模型熱潮的推動下,云計算廠商成為主要受益者之一,被視為實現(xiàn)彎道超車的機會。

預(yù)計大模型將帶動云上AI算力的急劇增長,逐漸縮小AI算力工作負載與通用算力的差距,為云廠商帶來新的機遇。

據(jù)硅谷知名風(fēng)投A16Z估計,應(yīng)用層廠商將大約20%—40%的收入用于推理和模型微調(diào),這部分收入通常直接支付給云廠商或第三方模型提供商。

而第三方模型提供商也將一半左右的收入用于云基礎(chǔ)設(shè)施。因此,生成式AI總收入的10%—20%流向了云提供商。

另一方面,OpenAI的研究表明,在最大規(guī)模的人工智能模型訓(xùn)練中,計算量呈指數(shù)級增長。

目前大模型訓(xùn)練所需算力的增速保持在3-4個月/倍速度增長,遠超摩爾定律的增速。

綜上所述,生成式AI的大量資金最終流向了基礎(chǔ)設(shè)施,AI大模型訓(xùn)練為云廠商帶來了可觀的直接營收。

同時,生成式AI推動了整個云服務(wù)行業(yè)的升級,為其帶來了新的市場增量。

傳統(tǒng)云生態(tài)過渡到新型云生態(tài)

傳統(tǒng)云生態(tài)以軟件、服務(wù)為核心。云計算興起過程中,一批銷售、軟件、服務(wù)、咨詢、集成伙伴自然聚合在云廠商周邊,形成了[云原生]生態(tài)。

云廠商與合作伙伴的默契是,只提供基本的公有云服務(wù)(如計算、存儲、網(wǎng)絡(luò)、數(shù)據(jù)庫),其他都交由合作伙伴負責(zé)。

這種生態(tài)的好處是邊界清晰、分工明確。但過去多年,中國云市場生態(tài)建設(shè)有大量不足之處。

中國市場應(yīng)用現(xiàn)代化水平還不高。集成項目、人力外包是目前的主流形態(tài)。這帶來的問題是,服務(wù)成本高、協(xié)同效率低。

大數(shù)據(jù)模型時代,新型的云生態(tài)系統(tǒng)將以多租戶平臺和AI原生應(yīng)用為核心。

經(jīng)過AI技術(shù)改造后的應(yīng)用軟件將在整個生態(tài)系統(tǒng)中發(fā)揮更加關(guān)鍵的作用。

原子化、單點化、碎片化的AI應(yīng)用將更為豐富,且更具價值。

其價值主要體現(xiàn)在解決上一代云生態(tài)系統(tǒng)的主要問題上,即降低服務(wù)成本、提高服務(wù)效率。

以AI為核心的大模型階段云生態(tài),正逐漸成為主流,并逐步取代舊的云生態(tài)。

這一歷史進程是由AI算力占比的持續(xù)上升和AI算力成本的持續(xù)下降所決定的。

據(jù)OpenAI預(yù)測,AI大模型的訓(xùn)練成本將持續(xù)快速下降,預(yù)計到2030年將降至僅60萬美元。

MaaS成趨勢,大模型服務(wù)是主流

隨著大模型的數(shù)量日益增多,眾多企業(yè)已認識到,獨立訓(xùn)練大模型并非明智之舉,反而基于現(xiàn)有的通用大模型進行二次開發(fā)更為實際且高效。

這一觀點與當(dāng)前大模型領(lǐng)域中普遍存在的[重復(fù)造輪子]現(xiàn)象的應(yīng)對策略相吻合。

在AI原生應(yīng)用大量涌現(xiàn)的背景下,除了前期的模型訓(xùn)練,云服務(wù)提供商的盈利空間將更多地來自于向開發(fā)者提供強大的基礎(chǔ)大模型,并針對各類業(yè)務(wù)場景和用戶需求收取AI應(yīng)用推理費用。

為了實現(xiàn)這一目標(biāo),云服務(wù)提供商需要確保計算服務(wù)的穩(wěn)定性和推理體驗的優(yōu)質(zhì)性,從而在激烈的市場競爭中脫穎而出。

最終,MaaS將成為新的基礎(chǔ)服務(wù),并依賴于新型IT基礎(chǔ)設(shè)施進一步顛覆當(dāng)前的云計算市場格局。

在過去數(shù)年中,穩(wěn)態(tài)業(yè)務(wù)通常部署在主機上,要求絕對穩(wěn)定性,而敏態(tài)業(yè)務(wù)則更多地構(gòu)建在云上,以滿足不斷變化的需求。

在此基礎(chǔ)上,目前存在兩種主要的上云模式:一種是平遷上云,成本較低且能保證數(shù)據(jù)可控性,但同時可用性也較低;

另一種則是將底層架構(gòu)徹底云原生化改造,雖然成本高、周期長,但可以為企業(yè)帶來長期利益。然而,很少有企業(yè)能夠承擔(dān)暫停服務(wù)器進行架構(gòu)改造的代價。

云服務(wù)提供商積極發(fā)力

目前,各大云服務(wù)提供商正在積極推出大模型平臺,旨在降低大模型的訓(xùn)練和使用成本。

百度推出了文心千帆大模型平臺,專門面向B端企業(yè)用戶。該平臺提供一站式的大模型定制服務(wù),包括數(shù)據(jù)管理、自動化模型定制微調(diào)以及推理服務(wù)云端部署等,同時還提供文心一言企業(yè)級推理云服務(wù)。

騰訊云推出了新一代HCC高性能計算集群,采用最新一代騰訊云星星海自研服務(wù)器和NVIDIA H800 Tensor Core GPU,提供高達3.2T的超高互聯(lián)帶寬。

阿里云推出了[魔搭社區(qū)],這是一個面向用戶的模型服務(wù)型平臺。該平臺致力于降低模型的使用門檻,為多個場景提供適配的API。

華為云的一站式AI開發(fā)平臺ModelArts為盤古大模型的訓(xùn)練和推理提供了全面的優(yōu)化支持,包括計算優(yōu)化、通信優(yōu)化、存儲優(yōu)化和算法優(yōu)化,成為盤古大模型重要的基礎(chǔ)平臺資源。

字節(jié)跳動旗下的云服務(wù)平臺火山引擎推出了智能推薦-高速訓(xùn)練引擎,采用軟硬一體優(yōu)化設(shè)計,支持100GB-10TB+超大模型的高效訓(xùn)練。

在大模型的影響下,云計算從互聯(lián)網(wǎng)時代的CPU云為主向AI時代的GPU云為主的轉(zhuǎn)變已成為行業(yè)共識和必然趨勢。

在更底層的芯片端,除了英偉達之外,高通、英特爾、Arm等廠商也開始將面向大模型訓(xùn)練與推理的芯片設(shè)計與生產(chǎn)納入工作日程,為下一個時代的可能性做好準(zhǔn)備。

然而,除了芯片種類與數(shù)量的變化,大模型對云計算廠商的影響其實體現(xiàn)在更深層面。

結(jié)尾:

對于大模型相關(guān)能力的研究和投入,各大云廠商必須給予足夠的重視。

通用人工智能的支持是大勢所趨,也是各大云廠商必須完成的任務(wù)。

在這方面,任何疏忽或缺失都可能導(dǎo)致無法在激烈的市場競爭中立足。

因此,各大云廠商應(yīng)將其視為一個必備的核心能力,不斷加大投入力度,以應(yīng)對不斷變化的市場需求和競爭態(tài)勢。

隨著新需求的涌現(xiàn),需要構(gòu)建與之相匹配的新生態(tài),并制定相應(yīng)的新策略。

部分資料參考:

財經(jīng)十一人:《大模型,即將改變云生態(tài)》,雷鋒網(wǎng):《年底了,我們來談?wù)勗朴嬎闩c大模型的那些事兒》,中國新聞周刊:《在云上,看見大模型的未來》,比特網(wǎng):《熱度不減的大模型,將給云計算市場帶來什么?》,科技云報到:《生成式AI將開啟云計算未來新十年?》,21世紀經(jīng)濟報道:《大模型時代,云廠商的雙重身份》

推薦器件

更多器件
器件型號 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊 ECAD模型 風(fēng)險等級 參考價格 更多信息
TJA1055T/3/CM,118 1 NXP Semiconductors TJA1055 - Enhanced fault-tolerant CAN transceiver SOIC 14-Pin

ECAD模型

下載ECAD模型
$1.95 查看
TJA1040T/CM,118 1 NXP Semiconductors TJA1040 - High-speed CAN transceiver with standby mode SOIC 8-Pin

ECAD模型

下載ECAD模型
$2.24 查看
TJA1055T/C,518 1 NXP Semiconductors TJA1055 - Enhanced fault-tolerant CAN transceiver SOIC 14-Pin
$2.67 查看

相關(guān)推薦

電子產(chǎn)業(yè)圖譜

AI芯天下是智能芯片行業(yè)垂直自媒體。采用媒體+行業(yè)的模式,堅持從芯出發(fā),用心服務(wù)的理念,致力于豐富的網(wǎng)絡(luò)基礎(chǔ)資源建設(shè)。官網(wǎng):http://www.world2078.com/ 公眾號:World_2078