傳聞是真的,微軟正在開發(fā)定制AI芯片,它可以用來訓(xùn)練大語言模型,讓微軟獲得更多獨立,避免過度依賴英偉達。不只如此,微軟還在開發(fā)Arm CPU,主要供云計算網(wǎng)絡(luò)使用。兩款芯片瞄準(zhǔn)的都是Azure數(shù)據(jù)中心,微軟企業(yè)客戶可以用它們來搭建AI平臺。
最新消息顯示,微軟Azure Maia AI芯片和Arm版Azure Cobalt CPU將會在2024年推出。目前市場上最流行的AI芯片是英偉達的H100 GPU,企業(yè)用它訓(xùn)練生成式圖形工具和大語言模型。英偉達GPU需求很高,供不應(yīng)求,網(wǎng)上標(biāo)價單塊已經(jīng)沖破4萬美元。
深度定制芯片
微軟Azure硬件系統(tǒng)和基礎(chǔ)設(shè)施主管Rani Borkar解釋說:“在芯片開發(fā)方面微軟實際上有很長的歷史?!?0多年前微軟就曾聯(lián)合其它企業(yè)開發(fā)Xbox芯片,還曾開發(fā)過Surface芯片?!八羞@些努力都是建立在經(jīng)驗之上的。2017年我們開始研究云計算硬件,開始研發(fā)自己的定制處理器。”
Rani Borkar稱,Azure Maia AI芯片和Cobalt CPU都是微軟自己開發(fā)的,當(dāng)中還涉及到云服務(wù)器堆棧,兼顧性能、能耗和成本?!癆I時代來臨,我們重新思考云基礎(chǔ)設(shè)施,重新優(yōu)化了基礎(chǔ)設(shè)施的每一層?!?/p>
Azure Cobalt CPU是一款128核芯片,它是基于ArmNeoverse CSS設(shè)計的,屬于微軟定制產(chǎn)品。芯片將會用來驅(qū)動Azure云服務(wù)。Rani Borkar說:“我們除了深入思考性能,還考慮到能耗管理。在設(shè)計時我們有意做了一些選擇,比如可以控制每個內(nèi)核的性能和能耗,還有它在虛擬機上的表現(xiàn)?!?/p>
目前微軟已經(jīng)在Teams、SQL服務(wù)器上測試Cobalt CPU,明年就會向客戶提供虛擬機。
全面提升性能
亞馬遜也開發(fā)了Graviton 3服務(wù)器,它與微軟服務(wù)器相比誰更勝一籌呢?微軟沒有明說,不過考慮到微軟Azure Cobalt CPU是基于Arm架構(gòu)開發(fā)的,性能上應(yīng)該有一些優(yōu)勢。Rani Borkar稱:“最初的測試顯示,微軟新品的性能比微軟現(xiàn)有數(shù)據(jù)中心中產(chǎn)品的性能高40%,目前用的是商用版Arm服務(wù)器。”
至于Maia 100 AI,它是面向AI開發(fā)的。有些企業(yè)想在Azure平臺上執(zhí)行AI任務(wù),Maia 100 AI可以幫上忙。微軟已經(jīng)與OpenAI攜手合作,設(shè)計測試Maia。
OpenAI CEO Sam Altman說:“很高興微軟在第一時間向我們分享了Maia芯片的設(shè)計,我們正在努力改進、測試模型。Azure提供的端到端AI架構(gòu)已經(jīng)針對Maia進行了優(yōu)化,未來可以幫助客戶訓(xùn)練更強大的模型,讓模型變得更便宜?!?/p>
Maia芯片是用臺積電5納米工藝制造的,擁有1050億晶體管,比AMD MI300X AI GPU的1530億個少30%。微軟、AMD、英特爾、Meta、英偉達、高通都在努力,它們試圖讓下一代AI模型數(shù)據(jù)模式實現(xiàn)標(biāo)準(zhǔn)化。
Rani Borkar說:“Maia是微軟開發(fā)的第一款真正的液冷服務(wù)器處理器。我們的目標(biāo)是打造更高密度、更高效率的服務(wù)器?!蔽④浶孪到y(tǒng)與當(dāng)前的數(shù)據(jù)中心是契合的,所以部署時會更快。
目前微軟正在利用GPT 3.5 Turbo、必應(yīng)AI、GitHub Copilot對Maia 100進行測試,只是部署還處在早期階段,所以微軟沒有提供具體的性能測試數(shù)據(jù)。
打造多樣化供應(yīng)鏈
因為缺少具體數(shù)據(jù)支撐,我們不知道Maia相比英偉達H100、AMD MI300X誰更強大。Rani Borkar不愿意和競爭對手對比,她只是說微軟與AMD、英偉達都有合作。微軟主要還是想打造多樣化供應(yīng)鏈,不想過度依賴英偉達。
照估計,為了讓ChatGPT商用,OpenAI采購了3萬顆A100 GPU芯片,如果微軟能擁有自己的芯片,就可以幫OpenAI降低成本。至于微軟為Azure開發(fā)的芯片,它不會對外出售。Borkar解釋稱:“它更多像是補充,不是為了與對手競爭。我們的云計算平臺上有AMD、英特爾芯片,在AI方面,除了英偉達芯片,我們也會用AMD芯片。對于我們的基礎(chǔ)設(shè)施而言,這些合作伙伴相當(dāng)重要,我們也想給客戶更多選擇。”
從Maia 100和Cobalt 100的命名看,微軟肯定已經(jīng)在設(shè)計第二代產(chǎn)品。Borkar說:“這是一個系列的產(chǎn)品,不只有100,還會有更多……不過我們暫時不會透露路線圖規(guī)劃?!?/p>
到目前為止微軟并沒有透露Maia的價格,不過微軟已經(jīng)悄悄推出微軟365 Copilot服務(wù),每月每用戶收費30美元,并不便宜,照此推測,Maia應(yīng)該也不會便宜。
從微軟的規(guī)劃看,Maia 100人工智能芯片的直接對手是英偉達GPU,Cobalt 100芯片主要針對英特爾處理器。截止10月底,微軟擁有現(xiàn)金1440億美元,2022年在全球云計算市場占據(jù)21.5%的份額。到了2024年,運行Cobalt 100芯片的虛擬機服務(wù)將會正式商用。
巨頭定制芯片大勢所趨
微軟的對手也沒有閑著。2016年谷歌推出Tensor處理器,2018年亞馬遜推出Graviton Arm處理器和Inferentia AI處理器,還于2020年推出Trainium(可以訓(xùn)練AI模型)。
從競爭對手的舉動看,微軟推出自有處理器也是隨了大流。在過去一年多時間里,芯片價格上漲,美國加息,企業(yè)不得不尋找辦法提高資金利用效率,于是它們開始偏愛AWS Graviton處理器。在AWS前100大客戶中,幾乎所有客戶都在使用ARM處理器,性價比提升了40%。
毋庸諱言,定制AI芯片已經(jīng)成為巨頭們必須參與的游戲,競爭會越來越激烈!(小刀)