蘋(píng)果芯片為何再次驚艷行業(yè)?揭秘不講常理的造芯思路。
芯東西3月9日?qǐng)?bào)道,今夜凌晨,蘋(píng)果又開(kāi)了一場(chǎng)“芯片上”的發(fā)布會(huì)!意料之內(nèi),芯片再次成為蘋(píng)果春季新品發(fā)布中最亮眼的存在;意料之外,傳聞已久的M2芯片沒(méi)有登場(chǎng),反而是M1系列推出旗艦版M1 Ultra,以將兩塊M1芯片“粘”在一起的設(shè)計(jì)思路,震驚全場(chǎng)。
作為M1系列Mac電腦芯片的第四彈,M1 Ultra成為了蘋(píng)果電腦芯片的終極武器。蘋(píng)果通過(guò)一個(gè)三步走的策略,幾近完成Mac兩年換芯的大計(jì),而且?guī)缀趺看味荚?ldquo;干翻”自己,也幾乎每次都在“教”芯片同行做事。
1140億顆晶體管、20核CPU、最高64核GPU、32核神經(jīng)網(wǎng)絡(luò)引擎、2.5TB/s數(shù)據(jù)傳輸速率、800GB/s內(nèi)存帶寬、最高128GB統(tǒng)一內(nèi)存……這些堪稱恐怖的規(guī)格全部集聚于一塊“至尊版”電腦芯片上。至此,蘋(píng)果在M1系列電腦芯片棋局上的落子,得以清晰而完整的展現(xiàn)。
▲蘋(píng)果M1系列四大芯片,從左至右:M1、M1 Pro、M1 Max、M1 Ultra
好馬配好鞍,M1 Ultra芯片被搭載于單臺(tái)3萬(wàn)元起售的臺(tái)式機(jī)主機(jī)Mac Studio上,號(hào)稱比最快的iMac性能最高提升3.4倍,比頂配Mac Pro性能提升80%。
這是蘋(píng)果繼早前圓柱形“垃圾桶”式外形、長(zhǎng)方形機(jī)箱式外形后,對(duì)專業(yè)級(jí)桌面主機(jī)形態(tài)的又一次嘗試。雖然外形第一眼看起來(lái)像一個(gè)加厚版的Mac mini,但其內(nèi)里從結(jié)構(gòu)到配置則完全不同。
▲Mac Studio
除了首次在頂級(jí)專業(yè)臺(tái)式Mac中采用自研M1系列芯片外,蘋(píng)果還第一次往顯示器新品Studio Display里塞了一顆A13仿生芯片,A13之前被用在2019年iPhone 11系列智能手機(jī)、2021年入門(mén)級(jí)iPad 9中。而加入手機(jī)SoC級(jí)別的芯片,用來(lái)強(qiáng)化攝像頭和音箱功能,也是蘋(píng)果的顯示器形態(tài)的一次新嘗試。不過(guò)目前蘋(píng)果專業(yè)顯示器的天花板仍然是那臺(tái)售價(jià)超4萬(wàn)元的XDR 6K專業(yè)顯示器。
Mac Studio主機(jī)和Studio Display顯示器都從3月10日9點(diǎn)起預(yù)購(gòu),主機(jī)3月18日發(fā)售,顯示器則要等獲批后發(fā)售。此外,新款iPad Air 5首次搭載與iPad Pro同款的M1芯片,第三代iPhone SE智能手機(jī)也換上了與最新iPhone 13系列同款的A15仿生芯片,兩款新品將從3月11日21點(diǎn)起預(yù)購(gòu),3月18日發(fā)售。
蘋(píng)果Mac換芯的策略是什么?這個(gè)性能突破天際的電腦芯片解決了哪些核心難題?下面,芯東西將著重復(fù)盤(pán)和解讀這背后的技術(shù)邏輯。
01.M1 Max + M1 Max = M1 Ultra
從2020年6月宣布Mac換芯計(jì)劃,并在當(dāng)年11月首推電腦芯片M1,到現(xiàn)在不到兩年的時(shí)間,蘋(píng)果已接近完成既定的“兩年芯片過(guò)渡計(jì)劃”,只差最后一款Mac Pro。去年蘋(píng)果推出性能爆棚的M1 Max芯片時(shí),大家普遍以為這已經(jīng)是M1系列芯片的封頂之作,畢竟M1 Max芯片已經(jīng)觸及臺(tái)積電N5制程可制造的極限,面積達(dá)到432mm²。結(jié)果,蘋(píng)果這次直接掀翻了臺(tái)式機(jī)芯片的天花板,亮出M1系列的真正收官之作——M1 Ultra。
據(jù)芯東西得知,M1 Ultra就是蘋(píng)果M1系列的最后一顆芯片,不會(huì)有第五顆了。而且從一開(kāi)始,蘋(píng)果就有清晰計(jì)劃要分為三個(gè)階段來(lái)將M1用到Mac產(chǎn)品:第一階段,進(jìn)入到普及性的Mac,包括MacBook Air、Mac Mini乃至入門(mén)版MacBook Pro;第二階段,來(lái)到更高階的MacBook Pro;第三階段,進(jìn)入專業(yè)級(jí)臺(tái)式機(jī)主機(jī),將桌面電腦性能推升到一個(gè)新的高度。
M1 Ultra采用臺(tái)積電5nm工藝,由兩塊M1 Max芯片拼接而成,這樣的“組合”使得其晶體管數(shù)量達(dá)到1140億顆,這也是蘋(píng)果自研芯片的晶體管數(shù)量首次突破1000億顆。該芯片的各項(xiàng)硬件指標(biāo)也翻番:20核CPU包含16個(gè)高性能核心、4個(gè)高能效核心;GPU核心數(shù)量增至64核;32核神經(jīng)網(wǎng)絡(luò)引擎能夠帶來(lái)每秒22萬(wàn)億次的運(yùn)算能力;統(tǒng)一內(nèi)存最高規(guī)格達(dá)到128GB;內(nèi)存帶寬提升至800GB/s,達(dá)到最新型號(hào)臺(tái)式PC芯片的10倍以上。同時(shí),M1 Ultra最高支持8TB的SSD固態(tài)硬盤(pán)存儲(chǔ)。
尤其是多die(Multi-die)GPU配置,可以說(shuō)是做了大膽而驚人的設(shè)計(jì),這里的核心難度在于高端部件通常消耗的內(nèi)部帶寬過(guò)高,超過(guò)1TB/s,致使將它們連接起來(lái)在技術(shù)上很難實(shí)現(xiàn)。像之前Mac Pro中用的傳統(tǒng)多GPU系統(tǒng),每個(gè)GPU都是獨(dú)立的。因?yàn)閹挷粔颍鄠€(gè)GPU難以在單個(gè)圖形任務(wù)上進(jìn)行有效地協(xié)同。但如果能通過(guò)某種方式將多個(gè)GPU借助die-to-die技術(shù)連接起來(lái),就可能在一個(gè)任務(wù)中同時(shí)使用它們。
這是多家芯片公司都在研究的問(wèn)題,目前看來(lái),蘋(píng)果似乎成為了第一家實(shí)現(xiàn)目標(biāo)的公司。在介紹M1 Ultra前,蘋(píng)果高管也就兩塊芯片“粘”在一起的難點(diǎn)賣了個(gè)關(guān)子,他說(shuō)直接采用兩塊芯片來(lái)增加芯片核心面積的方式很常見(jiàn),但以前這種做法會(huì)增加功耗、拖慢傳輸速率,給開(kāi)發(fā)者增加負(fù)擔(dān)。那么蘋(píng)果怎么做呢?今天,蘋(píng)果揭曉了其秘密武器——UltraFusion。
在對(duì)M1 Ultra做規(guī)劃時(shí),蘋(píng)果考慮到對(duì)統(tǒng)一內(nèi)存的擴(kuò)充,重點(diǎn)思考了延遲、帶寬、功耗和性能等指標(biāo),選擇采用了融合拼接的方式,并與合作伙伴(芯片代工制造方)進(jìn)行了非常密切的合作,來(lái)實(shí)現(xiàn)UltraFusion技術(shù)的應(yīng)用。這里涉及復(fù)雜的技術(shù)難關(guān),比如,為了做到統(tǒng)一的架構(gòu),上面和下面的芯片延遲需相同,CPU看到的必須是一致的。
蘋(píng)果要求其延遲不要超過(guò)一般的延遲,對(duì)性能的影響不到10%。此前M1系列芯片一直采用蘋(píng)果自己定制的封裝方式來(lái)實(shí)現(xiàn)高速統(tǒng)一內(nèi)存架構(gòu),而UltraFusion作為蘋(píng)果創(chuàng)新定制的多晶粒架構(gòu),是2.5D先進(jìn)封裝的一個(gè)最新例子。
其基本原理應(yīng)該是某種硅中介層(interposer)被鋪在兩個(gè)M1 Max芯片下面,兩個(gè)芯片之間的信號(hào)可以通過(guò)硅中介層的布線。這使得M1 Ultra芯片可同時(shí)傳輸超過(guò)10000個(gè)信號(hào),其連接密度是現(xiàn)有技術(shù)的兩倍,實(shí)現(xiàn)高達(dá)2.5TB/s低延遲處理器間帶寬,比業(yè)內(nèi)高端多芯片帶寬的4倍還多。
這意味著,M1 Ultra芯片雖然是兩個(gè)芯片的組合體,但在工作時(shí)會(huì)表現(xiàn)出一枚芯片的整體性,被所有軟件識(shí)別為一枚完整芯片,開(kāi)發(fā)者無(wú)需重寫(xiě)代碼就能直接運(yùn)用它的強(qiáng)大性能??梢哉f(shuō),史無(wú)前例。
總而言之,借助UltraFusion架構(gòu),蘋(píng)果成為第一家將兩個(gè)GPU拼在一起而且實(shí)現(xiàn)2.5TB/秒超高傳輸速率的芯片供應(yīng)商。
蘋(píng)果這些不按常理出牌的做法,背后其實(shí)是一種以解決問(wèn)題為第一目的實(shí)用主義原則在做指導(dǎo),比如他們把這個(gè)“粘接融合多個(gè)芯片”的UltraFusion架構(gòu)沒(méi)有當(dāng)做一個(gè)標(biāo)準(zhǔn)接口,只是他們?yōu)榱藢?shí)現(xiàn)M1 Ultra性能功耗目標(biāo)的一個(gè)工具,而如果后面遇到更大的挑戰(zhàn),說(shuō)不定還有整出怎樣更腦洞大開(kāi)的“工具”。
除了這些以外,M1 Ultra內(nèi)還集成了多種定制的蘋(píng)果技術(shù),如能夠同時(shí)驅(qū)動(dòng)多臺(tái)外接顯示器的顯示引擎、雷電4控制器集成、同類最佳的安全技術(shù),包括蘋(píng)果最新的安全隔區(qū)、基于認(rèn)證硬件的安全啟動(dòng)和運(yùn)行時(shí)防漏洞利用技術(shù)。
02.性能實(shí)測(cè):GPU功耗遠(yuǎn)低于英偉達(dá)3090
蘋(píng)果在特定電腦系統(tǒng)上進(jìn)行了性能測(cè)試,大致可以反映Mac Studio、Mac Pro和iMac的性能對(duì)比。
參與測(cè)試的Mac Studio系統(tǒng)配置為M1 Ultra芯片、128GB RAM、8TB 固態(tài)硬盤(pán),Mac Pro系統(tǒng)配備了3.2GHz 16核英特爾Xeon W處理器、192GB RAM、4TB固態(tài)硬盤(pán),27英寸iMac系統(tǒng)配備了3.6GHz 10核英特爾Core i9 處理器、128GB RAM、8TB固態(tài)硬盤(pán)。
根據(jù)蘋(píng)果提供的數(shù)據(jù),在相同功耗下,M1 Ultra處理多線程任務(wù)的速度比16核英特爾旗艦至強(qiáng)i9-12900K提升了90%;實(shí)現(xiàn)同樣性能時(shí),M1 Ultra的功耗比12900K少100W。
這里需注意的是,在多線程工作負(fù)載方面,蘋(píng)果可以說(shuō)一直都是頂級(jí)守擂者,但其在單線程方面有點(diǎn)擠牙膏,高性能核心已經(jīng)被英特爾新架構(gòu)超越。GPU方面尤其值得一提。
蘋(píng)果聲稱實(shí)現(xiàn)同樣的性能,M1 Ultra的功耗只有主流獨(dú)立GPU的1/3,或比最強(qiáng)顯卡英偉達(dá)GeForce RTX 3090少200W。
當(dāng)然,考慮到蘋(píng)果M1 Ultra采用的是臺(tái)積電5nm工藝,而英偉達(dá)3090采用的是三星8nm工藝,這里制造工藝的升級(jí)貢獻(xiàn)了一部分能效的提升。相比27英寸iMac中的AMD Radeon Pro 5700XT獨(dú)立顯卡,M1 Ultra的GPU性能提升高達(dá)4.5倍,甚至比起Mac Pro中的AMD Radeon Pro W6900X,性能提升幅度也達(dá)到了80%。下圖是蘋(píng)果關(guān)于8K渲染速度提升情況的測(cè)試結(jié)果。
M1 Ultra的媒體處理引擎資源同樣翻倍,其處理 ProRes格式視頻編解碼任務(wù)的吞吐能力提升至史上最高,最多可同時(shí)播放18條8K ProRes 422格式的視頻流。
03.將A13仿生芯片塞入顯示器
為了配合Mac Studio主機(jī),蘋(píng)果還推出了一款分辨率達(dá)5K級(jí)別的新顯示器產(chǎn)品Studio Display。
這款顯示器首次內(nèi)置了蘋(píng)果的自研旗艦手機(jī)芯片A13,用于優(yōu)化視頻人物居中、空間音頻和“嘿 Siri”等功能的處理能力。同時(shí),新款iPhone SE用上和iPhone 13系列同款的A15仿生芯片,有6核CPU和4核GPU,CPU性能比iPhone 8提升1.8倍,GPU處理速度比二代SE最高提升1.2倍,神經(jīng)網(wǎng)絡(luò)處理能力提升26倍。
iPad Air 5亦換上與iPad Pro同款的M1芯片,相比上代A14性能提升達(dá)到了60%,8核圖形處理器最高提速至2倍,16核神經(jīng)網(wǎng)絡(luò)引擎也讓機(jī)器學(xué)習(xí)性能大幅提升。
當(dāng)然,軟硬件協(xié)同是蘋(píng)果產(chǎn)品體驗(yàn)的一貫優(yōu)勢(shì),macOS系統(tǒng)和各款專業(yè)App已為蘋(píng)果M1系列芯片優(yōu)化,能夠充分利用M1 Ultra的性能。面向碳中和,蘋(píng)果稱其定制芯片的出色能效幫助 Mac Studio在整個(gè)產(chǎn)品生命周期內(nèi)消耗更少電力,并稱Mac Studio在一整年里所消耗的電力比起一臺(tái)高端配置的臺(tái)式PC可節(jié)省最高達(dá)1000千瓦時(shí)。
蘋(píng)果目前在全球公司運(yùn)營(yíng)方面已實(shí)現(xiàn)碳中和,計(jì)劃在2030年年底前讓全部公司業(yè)務(wù)實(shí)現(xiàn)碳中和,包括制造供應(yīng)鏈和所有產(chǎn)品生命周期在內(nèi)。這意味著蘋(píng)果所生產(chǎn)的每一枚芯片,從設(shè)計(jì)到制造,都將實(shí)現(xiàn)100%碳中和。
04.結(jié)語(yǔ):蘋(píng)果芯,干翻自己!
如今,蘋(píng)果已經(jīng)在幾乎所有的Mac產(chǎn)品線中全面應(yīng)用了其自研芯片。今天蘋(píng)果的推出M1 Ultra芯片,雖說(shuō)與此前盛傳的M2芯片不符,但其直接將兩塊GPU連在一起的設(shè)計(jì)思路,乍一看有些出乎意料,但細(xì)想其實(shí)是非常合理的進(jìn)化方向。
決心在自研電腦芯片上一往無(wú)前后,蘋(píng)果每一次推出的M1系列芯片新品類都是各種先進(jìn)技術(shù)的集大成者,并且每一次都創(chuàng)造了一個(gè)新的芯片設(shè)計(jì)高地,誰(shuí)能想到當(dāng)初驚艷登場(chǎng)的M1芯片,如今竟成了M1系列中最低配的存在呢?
在單個(gè)芯片觸達(dá)實(shí)際尺寸極限后,蘋(píng)果開(kāi)始走堆料路線,并通過(guò)創(chuàng)新架構(gòu)將多個(gè)芯片封在一起,實(shí)現(xiàn)更強(qiáng)悍的性能效果。理論上,三個(gè)乃至更多芯片的組合,也是可以實(shí)現(xiàn)的,不過(guò)據(jù)芯東西了解,蘋(píng)果暫無(wú)這么做的興趣。
至于M1芯片終極版本究竟能在實(shí)際產(chǎn)品中發(fā)揮出怎樣的水準(zhǔn)?我們非常期待看到它在后續(xù)實(shí)測(cè)的表現(xiàn)。
編譯 | ZeR0
編輯 | 漠影