作者?|??ZeR0
編輯?|??漠影
利用光學(xué)I/O推動(dòng)AI革命。
什么樣的初創(chuàng)公司,能同時(shí)拿到英偉達(dá)、AMD、英特爾三大芯片巨頭的投資?答案是Ayar Labs。芯東西12月12日?qǐng)?bào)道,硅谷光互連芯片設(shè)計(jì)公司Ayar Labs昨日宣布完成英偉達(dá)、AMD、英特爾、格芯等參投的1.55億美元融資。與臺(tái)積電有戰(zhàn)略合作關(guān)系的VentureTech Alliance、美國(guó)機(jī)器制造巨頭3M也參與了此輪融資。
目前其累計(jì)融資達(dá)3.7億美元,估值已超過(guò)10億美元,成為新晉芯片獨(dú)角獸。Ayar Labs聯(lián)合創(chuàng)始人兼CEO馬克·韋德(Mark Wade)說(shuō):“領(lǐng)先的GPU提供商AMD和英偉達(dá)以及半導(dǎo)體代工廠格芯、英特爾代工、臺(tái)積電,再加上Advent、Light Street和我們其他投資者的支持,凸顯了我們的光學(xué)I/O技術(shù)重新定義AI基礎(chǔ)設(shè)施未來(lái)的潛力?!鲍@得如此多芯片巨頭的青睞,Ayar Labs憑什么?
01.AI的下一個(gè)百萬(wàn)倍加速,需要光互連等先進(jìn)技術(shù)
Ayar Labs成立于2015年,總部位于加州圣何塞,專門(mén)為大規(guī)模AI工作負(fù)載提供光互連解決方案。其瞄準(zhǔn)的賽道,如今正是下一代AI基礎(chǔ)設(shè)施建設(shè)的關(guān)鍵技術(shù)之一。高盛近日發(fā)布的一份報(bào)告預(yù)測(cè),未來(lái)十年,AI基礎(chǔ)設(shè)施支出預(yù)計(jì)將超過(guò)1萬(wàn)億美元。這凸顯了對(duì)消除傳統(tǒng)銅互連、可插拔光學(xué)器件造成的瓶頸的解決方案的迫切需求。當(dāng)前大多數(shù)數(shù)據(jù)中心的運(yùn)營(yíng)依賴于傳統(tǒng)的電互連,銅線是數(shù)據(jù)中心短距離信息傳輸?shù)臉?biāo)準(zhǔn)。AI服務(wù)器系統(tǒng)在持續(xù)傳輸數(shù)據(jù)過(guò)程中會(huì)消耗大量電力,打破現(xiàn)有AI基礎(chǔ)設(shè)施瓶頸的有效解法之一,便是采用光互連技術(shù)來(lái)加速通信。
采用傳統(tǒng)互連時(shí),隨著AI模型復(fù)雜性增加,系統(tǒng)效率會(huì)降低。據(jù)Ayar Labs官網(wǎng)分享,一顆GPU的運(yùn)行效率為80%,64顆GPU的運(yùn)行效率可能是50%,256顆GPU的運(yùn)行效率可能只有30%了。光學(xué)I/O則能夠針對(duì)提高AI基礎(chǔ)設(shè)施的性能和能效。英偉達(dá)數(shù)據(jù)中心產(chǎn)品首席平臺(tái)架構(gòu)師羅伯·奧伯(Rob Ober)認(rèn)為,過(guò)去十年,英偉達(dá)加速計(jì)算已經(jīng)為AI帶來(lái)百萬(wàn)倍的加速,而下一個(gè)百萬(wàn)倍的加速將需要光學(xué)I/O等全新技術(shù),來(lái)支持未來(lái)AI/ML工作負(fù)載和系統(tǒng)架構(gòu)的帶寬、功率和規(guī)模要求。OpenAI計(jì)算主管克里斯托弗·伯納(Christopher Berner)也強(qiáng)調(diào)道,橫向擴(kuò)展期間的互連帶寬對(duì)于防止加速器在等待網(wǎng)絡(luò)傳輸或梯度時(shí)停轉(zhuǎn)至關(guān)重要。
02.突破數(shù)據(jù)移動(dòng)瓶頸,用光互連加快AI系統(tǒng)通信速度
此前光一直被用于數(shù)據(jù)傳輸,只不過(guò)主要用于電信網(wǎng)絡(luò)的長(zhǎng)距離通信中。Ayar Labs則將這項(xiàng)技術(shù)塞進(jìn)了芯片封裝里。
該公司開(kāi)發(fā)了業(yè)界首款針對(duì)大規(guī)模AI工作負(fù)載優(yōu)化的封裝內(nèi)光學(xué)I/O解決方案。相比采用可插拔光學(xué)器件+電氣SerDes的傳統(tǒng)互連,Ayar Labs的方案可實(shí)現(xiàn)5~10倍的更高帶寬、4~8倍的能效,并將延遲降低至1/10。其方案結(jié)合了兩項(xiàng)行業(yè)首創(chuàng)技術(shù)——TeraPHY光學(xué)I/O Chiplet和SuperNova多波長(zhǎng)光源。TeraPHY可集成到客戶的SoC封裝中,利用其SuperNova遠(yuǎn)程光技術(shù)實(shí)現(xiàn)更快的芯片間通信,從而幫助客戶最大限度地提高AI基礎(chǔ)設(shè)施的計(jì)算效率和性能,還能提高“AI應(yīng)用的盈利能力指標(biāo)”。
TeraPHY光學(xué)I/O Chiplet是一款體積小、功耗低、吞吐量高的銅背板和可插拔光學(xué)通信替代方案,其模塊化多端口設(shè)計(jì)科承載8個(gè)光通道(相當(dāng)于x8 PCIe Gen5鏈路)。
它將硅光子學(xué)與標(biāo)準(zhǔn)CMOS制造工藝結(jié)合,使專用集成電路(ASIC)能跨越從毫米到千米的距離進(jìn)行通信,相當(dāng)于形成一個(gè)巨型GPU。每個(gè)端口有256Gbps,每個(gè)Chiplet有2Tbps。
萬(wàn)億參數(shù)AI模型和高性能計(jì)算(HPC)設(shè)計(jì)需要不斷增加的帶寬。Ayar Labs光學(xué)I/O提供4Tbps的總雙向帶寬,為生成式AI架構(gòu)開(kāi)辟了新的可能性。高性能計(jì)算(HPC)和AI的分布式計(jì)算系統(tǒng)無(wú)法容忍傳統(tǒng)電氣I/O前向糾錯(cuò)帶來(lái)的數(shù)十納秒額外延遲。而Ayar Labs光學(xué)I/O的延遲為每Chiplet + TOF 5納秒,無(wú)需前向糾錯(cuò)。為了使電氣I/O和可插拔光學(xué)器件能夠穿越系統(tǒng)、機(jī)架和數(shù)據(jù)中心,112 Gbps長(zhǎng)距離電氣I/O會(huì)消耗6-10pJ/b的能量。Ayar Labs光學(xué)I/O消耗的能量則不到5pJ/b(10W)。
SuperNova是首款符合CW-WDM MSA標(biāo)準(zhǔn)的多波長(zhǎng)、多端口光源,最多支持將16種波長(zhǎng)的光傳輸至16根光纖。
與CWDM4多波長(zhǎng)可插拔光學(xué)器件相比,其波長(zhǎng)增加了64倍。該光源可驅(qū)動(dòng)256個(gè)光學(xué)載波,實(shí)現(xiàn)16Tbps的雙向帶寬。
Ayar Labs基于開(kāi)放標(biāo)準(zhǔn)(UCIe、CXL、CW-WDM MSA),使其能順利大規(guī)模集成到AI系統(tǒng)中。這些芯片由格芯生產(chǎn)。Ayar Labs還與英特爾合作,將其技術(shù)集成到英特爾的制造產(chǎn)品中。該公司也在與臺(tái)積電洽談。HPE、英特爾、洛克希德·馬丁、英偉達(dá)都是Ayar Labs的技術(shù)合作伙伴。其供應(yīng)鏈合作伙伴包括格芯、MACOM、Sivers Semiconductors等。
03.瞄準(zhǔn)AI數(shù)據(jù)中心挑戰(zhàn)的硅光子學(xué)競(jìng)爭(zhēng)者們
幾個(gè)月前,Ayar Labs開(kāi)始向部分客戶出貨了約15000臺(tái)設(shè)備。馬克·韋德希望到2026年中期,其芯片能實(shí)現(xiàn)大批量生產(chǎn);到2028年及以后,每年出貨量可達(dá)到1億臺(tái)以上。Advent Global Opportunities和Light Street Capital是Ayar Labs最新融資的領(lǐng)投方。Advent Global Opportunities合伙人喬丹·卡茨(Jordan Katz)將加入Ayar Labs董事會(huì)。他相信光互連技術(shù)將徹底改變AI基礎(chǔ)設(shè)施的未來(lái),而他認(rèn)為Ayar Labs是引領(lǐng)這場(chǎng)革命的最佳初創(chuàng)公司。其他投資方中,英偉達(dá)正在基板層實(shí)現(xiàn)光學(xué)互連,英特爾也在今年早些時(shí)候展示了芯片間光通信。不過(guò),Ayar Labs并非光互連領(lǐng)域的獨(dú)孤求敗。今年9月,瑞士光互連創(chuàng)企Lightium AG完成700萬(wàn)美元種子輪融資,投資方包括谷歌等;10月,美國(guó)光子計(jì)算及網(wǎng)絡(luò)創(chuàng)企Lightmatter完成4億美元D輪融資,總?cè)谫Y額達(dá)到8.5億美元,估值超過(guò)44億美元;同樣在10月,另一家美國(guó)光子技術(shù)創(chuàng)企Xscape Photonics完成4400萬(wàn)美元A輪融資,由思科、英偉達(dá)等參投。在國(guó)內(nèi),上海曦智科技是全球首家以光計(jì)算和光互連為核心的AI芯片公司,已經(jīng)構(gòu)建光子計(jì)算和光子網(wǎng)絡(luò)兩大產(chǎn)品線,其Photowave系列是業(yè)界首款兼容PCIe 5.0和CXL 2.0協(xié)議的光互連硬件產(chǎn)品,數(shù)據(jù)傳輸延遲可以達(dá)到20納秒(+TOF*)以內(nèi),其中有源光纜延遲可低至1納秒以下。曦智科技的首個(gè)CPO共封裝光學(xué)項(xiàng)目也正在落地中。
04.結(jié)語(yǔ):重新思考AI系統(tǒng)架構(gòu)
大模型推動(dòng)計(jì)算資源需求激增,需要數(shù)百乃至數(shù)千個(gè)互連的GPU和其他加速器,這意味著數(shù)據(jù)要以閃電般的速度在芯片與存儲(chǔ)設(shè)備之間流轉(zhuǎn)。硬件利用率低、功耗飆升、成本增加等重壓之下,傳統(tǒng)互連方案越來(lái)越難以承擔(dān)多模態(tài)AI系統(tǒng)所需的成本和吞吐量。從云計(jì)算大廠到智算基建商,都在探索新的數(shù)據(jù)中心架構(gòu)設(shè)計(jì),升級(jí)硬件和軟件基礎(chǔ)設(shè)施。芯片巨頭們已經(jīng)盯上了光互連技術(shù),以期利用光學(xué)特性突破固有瓶頸,提高AI基礎(chǔ)設(shè)施的性能和計(jì)算效率,同時(shí)降低成本和功耗。隨著更多資本涌向這一賽道,光互連商業(yè)化落地進(jìn)程正在提速中。