圍繞AI算力展開的政治博弈,一直在此起彼伏地發(fā)生著。
不過,事情也在悄然發(fā)生變化。
我們發(fā)現(xiàn),那種“美國一禁運,中國就破防”的緊張情緒,已經(jīng)減弱了很多。
前不久,美國商務(wù)部出了一份《采取額外措施應(yīng)對與重大惡意網(wǎng)絡(luò)行為相關(guān)的國家緊急狀態(tài)》提案,提出:禁止中國公司使用美國的云計算資源來訓(xùn)練AI模型。
這相當于AI芯片禁運的“補丁”。美國商務(wù)部長吉娜·雷蒙多在采訪時提到,美國的云數(shù)據(jù)中心也大量使用AI芯片,而美國對芯片實施了出口管制,也必須考慮關(guān)閉這條路徑。
這一次,中國AI業(yè)內(nèi)和大眾的情緒都還算穩(wěn)定。
一方面表現(xiàn)在語言上。AI行業(yè)群內(nèi)對這個提案的討論都很少,并不是諱莫如深,而是一種“早已料到”的淡定,倒是對國產(chǎn)算力替代、通用算力訓(xùn)練AI等話題的關(guān)注度,不斷提升。
另一方面表現(xiàn)在行動上。各個AI企業(yè)、大模型公司,也并沒有急著“下美國云”,或是緊急研究什么避險方案。要知道之前英偉達H100和A100芯片被禁運時,產(chǎn)業(yè)各方都迅速反應(yīng),英偉達隨即推出定制版,國內(nèi)大廠瘋搶囤貨,緊張感拉滿。
同樣是對AI算力的限制,為什么美國云基礎(chǔ)設(shè)施,不再讓我們 “汗流浹背”了?從一張“啞火”的AI禁令背后,我們可以讀到很多。
新AI禁令影響到底有多大?
先說結(jié)論:沒多大。
可能有人要急了,AI算力供需本就緊張,芯片不讓賣、云也不給用,你還說沒事,心也太大了吧?
知道你很急,但你先別急。
第一,美國云廠商在國內(nèi)公有云市場的份額很小,并且越來越小。
按美國商務(wù)部長的說法,被要求審核中國AI公司身份的美國基礎(chǔ)設(shè)施即服務(wù) (IaaS) 提供商,主要包括亞馬遜AWS、微軟Azure、英偉達算力云等。
微軟Azure、英偉達算力云的中國市場份額,小到無法擁有姓名。IDC近日發(fā)布的《中國公有云服務(wù)市場(2023年第三季度)跟蹤》報告顯示,2023年第三季度,中國公有云(IaaS+PaaS)市場中,唯一占據(jù)一席之地的美國云服務(wù)商是AWS,其市場份額也只有8.2%。并且相比2022年第三季度的8.5%,占比還有所下降。所以說,受該禁令影響的中國用戶數(shù)量并不多。
第二,美國云廠商的中國用戶,使用量也都不大。
目前使用AWS、azure等美國云數(shù)據(jù)中心的中國用戶,以外企的中國機構(gòu)、出海中企、混合部署等需求為主。艾瑞咨詢曾在《2021年中國基礎(chǔ)云服務(wù)行業(yè)數(shù)據(jù)報告》中,首次增加了“出海業(yè)務(wù)”,亞馬遜AWS的市場排名立馬從第五挺進前三,說明其國內(nèi)業(yè)務(wù)的“出?!北壤龢O高。
外企在中國、中企走出去,是一個目前還不算主流的邊緣市場。而混合多云部署的中國政企客戶,“不把雞蛋放在同一個籃子里”,目的是分散風(fēng)險,美國廠商的云本身就是“備胎”,當然也不會將太多核心業(yè)務(wù)放在上面。
第三,美國云的AI黏性有限,中國主流的AI大模型及應(yīng)用都在國內(nèi)云上。
有人會擔(dān)心,微軟云azure支持OpenAI那么領(lǐng)先的大模型,還有各種AI套件,肯定會吸引一部分國內(nèi)用戶,通過云訪問調(diào)用其AI能力吧?
一方面,OpenAI的大模型并不向大陸開放,IaaS層面的計算資源差異性不大,海外云的吸引力也就大打折扣。另外,要讓AI模型跑得“多快好省”,不僅要有萬卡集群的硬實力,還需要軟硬協(xié)同優(yōu)化、異構(gòu)硬件兼容、開發(fā)工具鏈、社區(qū)生態(tài),甚至商業(yè)資源、聯(lián)合開發(fā)等各種支持,國內(nèi)云廠商無疑更具本土化優(yōu)勢,也成為中國產(chǎn)學(xué)研用機構(gòu)做AI的首選。
政企客戶和國計民生關(guān)鍵行業(yè),自主可控已經(jīng)成為共識,紛紛選擇成為國內(nèi)云廠商的客戶。2023百度云智大會的一組數(shù)據(jù)顯示,千帆大模型平臺上的月活企業(yè)數(shù),已近萬家。
具備底層技術(shù)的中國AI大模型企業(yè),更是從一開始,就將大模型部署在國內(nèi)的云上。2023年7月,訊飛星火就與華為昇騰AI聯(lián)合,讓國產(chǎn)大模型架構(gòu)在自主創(chuàng)新的軟硬件基礎(chǔ)之上,打造國產(chǎn)通用智能新底座。最新升級的訊飛星火認知大模型 V3.5,也強調(diào)自己是“國產(chǎn)算力原生模型”。
所以說,美國云服務(wù)商在中國大陸的市場份額少,業(yè)務(wù)體量小,AI黏性又不夠強,因此對中國AI的影響有限,從而導(dǎo)致了此次禁令的“啞火”。
不是N卡用不起而是國產(chǎn)算力更有性價比
這樣會不會出現(xiàn)一種情況,像20世紀熊貓EDA那樣,美國一看禁了個寂寞,干脆放開來搶市場,國內(nèi)用戶就流向了海外云平臺?
大概率也是不會出現(xiàn)的。
因為國產(chǎn)算力并不只有安全自主可控這一個“賣點”,性價比優(yōu)勢對中國AI產(chǎn)業(yè)界也很有吸引力,而這是英偉達AI芯片很難取代的。
坦率地說,我們的芯片制造工藝確實還做不出頂級的強大芯片,性能上不比N卡強,為什么國產(chǎn)算力還能有高性價比呢?
高性價比的背后,是國內(nèi)云廠商從三個角度的努力:
一是自建多樣化的國產(chǎn)算力平臺。
除了英偉達的高端GPU,國產(chǎn)AI芯片、通用CPU算力、超算中心算力,也都能處理AI專項任務(wù),而且成本上更具優(yōu)勢。目前,云廠商都在強化對國產(chǎn)硬件的兼容性,積極構(gòu)建國產(chǎn)算力體系。
具體來說,華為的AI芯片制造技術(shù)已經(jīng)開始取得突破,昇騰系列穩(wěn)定出貨,在某些性能上甚至超越了英偉達的中國特供版。海光、華為、飛騰等自主設(shè)計開發(fā)的CPU/DCU芯片,既可以確保自主可控,也容易規(guī)?;慨a(chǎn)。已經(jīng)建好的超算中心,也可以為AI提供算力服務(wù)。
多樣化、異構(gòu)的國產(chǎn)算力體系,可以緩解AI和云計算對高端GPU的緊缺。
記得一位中科院的科學(xué)家跟我說過:等到智算、超算沒有分界線的那一天,中國AI可能就真的崛起了。而國產(chǎn)算力從硬件走上云端,轉(zhuǎn)變?yōu)锳I云服務(wù),正在加速這一天的到來。
二是算力網(wǎng)絡(luò)的一體化調(diào)度。
OpenAI訓(xùn)練ChatGPT等采用的是“集中式”算力,即萬卡集群。中國沒有那么多先進的卡怎么辦?用“分布式”算力,把各個地區(qū)的算力網(wǎng)互聯(lián)互通,一樣可以給AI企業(yè)提供算力服務(wù)。
舉個例子,北京、上海、廣州、武漢等地都有2000塊卡的算力中心,把它們通過專網(wǎng)聯(lián)合起來,就能組建起一萬塊、兩萬塊卡的算力平臺,代替一個萬卡集群,來做超大規(guī)模數(shù)據(jù)訓(xùn)練。
“分布式”算力,就需要把分布在全國各地的智算中心、云計算中心、超算中心給聯(lián)接起來。早在2020年,國家多部門就出臺了《關(guān)于加快構(gòu)建全國一體化大數(shù)據(jù)中心協(xié)同創(chuàng)新體系的指導(dǎo)意見》,建立橫跨東西的算力網(wǎng)絡(luò)與數(shù)據(jù)存算一體化節(jié)點,可以有效調(diào)節(jié)中國算力供需。通過統(tǒng)一算力調(diào)度平臺,可以將數(shù)據(jù)源周圍的閑置算力資源調(diào)度起來,更高效地滿足AI產(chǎn)業(yè)各界的巨大需求。
三是技術(shù)創(chuàng)新的算力榨取。
當然,國產(chǎn)算力要在性能上達到頂級GPU的能力,確實有些為難。所以,盡可能地榨取國產(chǎn)算力,讓其精準適配AI訓(xùn)練推理等任務(wù)的需求,會讓資源利用率更高,成本效益更加顯著。
提升算效,發(fā)揮出每一張卡的價值,需要一系列創(chuàng)新技術(shù)的支持,軟硬件聯(lián)合優(yōu)化,計算行業(yè)與AI行業(yè)的協(xié)作。云廠商聯(lián)合基礎(chǔ)設(shè)施供應(yīng)商、AI產(chǎn)研各方,積極開展技術(shù)創(chuàng)新,提升算力訓(xùn)練效率。
比如,百度智能云千帆平臺,就通過分布式并行訓(xùn)練策略和微秒級互聯(lián)能力,讓萬卡訓(xùn)練集群的加速比達到95%,也就是發(fā)揮出了95%比例的機器的效能。
總結(jié)一下,讓中國AI發(fā)展不掣肘于芯片供應(yīng),國內(nèi)云廠商真的很努力。
今天再面對一紙“禁令”,中國AI也可以淡定地說一句:不是N卡用不起,而是國產(chǎn)算力更有性價比。
備戰(zhàn)是為了不戰(zhàn)中國AI的未來通道
如今,對于AI算力,或許我們可以暫時放下緊張情緒,對相關(guān)禁令松一口氣了。
必須強調(diào)一點,自主可控不是為了全面替代。徹底脫離海外AI軟硬件的供應(yīng)鏈,既不現(xiàn)實,也沒有經(jīng)濟效益。
有句話說得好,要把槍放在談判桌上。
當我們有了自主的AI基礎(chǔ)設(shè)施,自己的AI軟硬件開發(fā)生態(tài),不用擔(dān)心“美國一禁運,就沒有算力用”,對方?jīng)]有了“博弈”的籌碼,一通操作結(jié)果禁了個寂寞,自然也就沒有必要再繼續(xù)折騰了。如此,才有可能避免“擦槍走火”,讓算力供應(yīng)維持一個比較平衡和穩(wěn)定的外部環(huán)境。
所以說,備戰(zhàn)是為了不戰(zhàn)。
當然,一波又一波的禁令也表明,圍繞AI這一關(guān)鍵領(lǐng)域的博弈只會愈演愈烈。昨天禁芯片,今天禁云服務(wù),明天禁什么不知道,但禁令一定會“雖遲但到”。
這種局勢下,我們也要做好更多準備,才能在較量中獲得話語權(quán)。
云計算作為中國AI的戰(zhàn)略支柱,國內(nèi)云廠商想要接住“潑天的富貴”,接下來還有許多工作要做:
1.做好國內(nèi)算力基礎(chǔ)設(shè)施與一體化算力網(wǎng)絡(luò)的有效應(yīng)用。
比如AI芯片種類繁多,既有不同品類,也有不同版本,兼容難度非常大,AI企業(yè)想用到最合適的芯片,有較高的切換成本,云平臺對國產(chǎn)芯片的兼容性更強,能夠減少企業(yè)AI訓(xùn)練的難度。再比如,算力網(wǎng)互聯(lián)以后,異構(gòu)算力怎么標識、怎么調(diào)度、怎么計費、通信協(xié)議怎么解決、資源配置效率怎么提升……這些問題都是需要持續(xù)解決的,也構(gòu)成了國內(nèi)云廠商的機遇。
2.提供全棧AI能力和完善的遷移服務(wù)。
AI大模型的技術(shù)復(fù)雜性也帶來了采用、部署等方面的挑戰(zhàn),云廠商可以通過更友好、全面的AI能力和遷移能力,支持行業(yè)客戶與開發(fā)者,建立起自己的AI生態(tài)系統(tǒng),收獲業(yè)務(wù)增長。
3.加強出海業(yè)務(wù)及服務(wù)能力。
前面提到,禁令的影響范圍,可能是AWS上一些外企在華、中企出海的業(yè)務(wù)。這也提醒我們,中國的云服務(wù)商,不能故步自封,要積極出海,給中國企業(yè)在海外,搭建一條可信、可靠的通道,支撐它們海外業(yè)務(wù)的持續(xù)開展。目前,擁有全球化經(jīng)驗和業(yè)務(wù)布局的華為云,已經(jīng)加速了歐洲、中東等市場的腳步,給中企出海、外企入中一個“更好的選擇”。
莫聽穿林打葉聲,何妨吟嘯且徐行。這些技術(shù)、產(chǎn)品與解決方案,匯合成一條中國AI前進的云端通道。讓我們可以看到禁令,從容以對。因為AI基礎(chǔ)設(shè)施,中國已經(jīng)做好了準備。