2023年是國產(chǎn)CPU性能爆發(fā)式提升的一年,無論是X86、ARM路線CPU,還是自主指令集CPU,其IPC和單核性能均大幅提升。國產(chǎn)CPU性能已經(jīng)足以滿足日常使用,在信創(chuàng)市場的大部分應(yīng)用場景中已經(jīng)性能過剩,各家CPU呈現(xiàn)出你追我趕的態(tài)勢。
龍芯
龍芯發(fā)布了3A6000,這款CPU的SPEC06定點成績達到43+,在IPC上的飛躍是最讓人驚駭?shù)?,?A5000的10+/G,一下子提升到17+/G,在IPC上追平英特爾13代酷睿,在單核性能上,2.5Ghz的3A6000就足以打平3.6Ghz的10代I3。有鑒于愛好者把3A6000的主頻提升到2.7Ghz,以及華碩主板+散熱改善后可以把主頻提升到3Ghz,足以證明3A6000的巨大潛力。
另外,基于LA664開發(fā)的3D6000,這款服務(wù)器CPU的潛力非常巨大,由于服務(wù)器CPU的主頻普遍偏低,這會抹平龍芯在主頻上與英特爾的差距。明年流片的3B6000,規(guī)劃是微結(jié)構(gòu)小改,工藝保持不變,IPC達到20/G,主頻2.5G,SPEC06定點超過50分。這個單核性能將繼續(xù)領(lǐng)跑國產(chǎn)CPU。3B6000發(fā)布后,龍芯市場推廣的最大問題已經(jīng)是不再是硬件性能,還是軟件生態(tài)。
SW ? ?
SW由相關(guān)單位設(shè)計,在超算上非常成功,神威超算多次在TOP500上名列第一,由于種種原因,SW的相關(guān)信息官宣甚少。申威用實踐證明,獨立自主與CPU高性能可以兼得,沒必要一定依附于X86和ARM,中國人自主定義指令集完全走的通。
飛騰
飛騰今年發(fā)布了S5000C。根據(jù)此前PPT,S5000搭載FTC860核,2.8GHz,SPEC06不少于25分。由于失去臺積電流片渠道,只能選擇境內(nèi)工藝,因而主頻有所降低,在官方PPT上,S5000C的成績是SPEC06不少于22分。
另一個PPT上,S5000C的核心是FTC862核,采用境內(nèi)工藝,宣稱是境內(nèi)設(shè)計,境內(nèi)流片,首個國產(chǎn)工藝DDR5和PCIe5.0。單核成績?yōu)?1.9,這比此前公布的不少于22分高了30%以上。
有鑒于SPEC17測試中,使用phygcc編譯器,F(xiàn)T2000/4能跑到3分,而gcc下測試成績?yōu)?.93,phygcc編譯器的優(yōu)化效果堪比ICC對X86的優(yōu)化。
因而存在2個可能,一是FTC862比FTC860強30%以上,二是FTC862單核SPEC06 31.9的成績同樣使用了phygcc編譯器,并且開了一些優(yōu)化選項。
當(dāng)然,能夠通過編譯器優(yōu)化也是本事,畢竟最終用戶體驗等于軟件+硬件,只要phygcc的代碼能夠被納入GCC最新版本,被大家廣泛使用,或者phygcc能夠在特定領(lǐng)域小范圍推廣開,那么這種優(yōu)化就是有效的。如果phygcc只是敝帚自珍,開源軟件和商業(yè)軟件都不用,那么這種優(yōu)化跑分就只能像ICC跑分那樣自娛自樂了。
總結(jié)一下,S5000C的IPC實現(xiàn)了大飛躍,這個IPC已經(jīng)很不錯了,F(xiàn)TC860核可以對標(biāo)ARM A76,F(xiàn)TC862性能在ARM A76和A78之間。
鐵流傾向于FTC862略強于FTC860,但和ARM A78有差距,這一點從官方PPT上,在制造工藝從臺積電7nm變成成熟工藝后,S5000的SPEC06 int是不少于25分,而S5000C的SPEC06 int是不少于22,這可以看出來,兩者是同一代,而且在工藝降級后主頻下降,單核性能也隨之下降。
從以往的PPT上,F(xiàn)TC862只是FTC860同一代小改版本,CPU基本框架差不多,IPC提升30%的性能差距必須是CPU核換代才行,SPEC06 ?31.9的成績高概率是phygcc編譯器下跑出的成績。
不過,無論是單核22+,還是單核31.9,對于信創(chuàng)來說已經(jīng)夠用了,在單核和多核上,相對于上一代S2500、FT2000/G等CPU都是巨大的提升。
兆芯
2023年,兆芯發(fā)布了KX-7000,KX-7000在目前所有國產(chǎn)CPU中主頻最高,基頻3.0到3.2Ghz,最高工作頻率3.7Ghz。據(jù)網(wǎng)友跑分泄露,spec06(@3.7G)定點超過40分,IPC達到10+/G,在IPC上相對于KX-6000提升巨大,已經(jīng)接近第二代銳龍。
相對于其他國產(chǎn)CPU,KX-7000集成了GPU,支持DirectX12、OpenCL 1.2、OpenGL 4.6以及H.265硬件編解碼,最高支持雙路4K顯示。這會使兆芯電腦不需要額外獨立顯卡,降低了整機成本。
在信創(chuàng)市場中,兆芯spec06 40分的性能已經(jīng)明顯過剩了。過去,兆芯的IPC只有6/G,這次IPC提升到10+/G,提升巨大,也許正如AMD開發(fā)出銳龍一舉翻身,兆芯KX-7000會使改變公眾對兆芯的既往印象。
由于兆芯一直有價格優(yōu)勢,只要兆芯繼續(xù)發(fā)揮這方面的優(yōu)勢,進一步壓縮成本,加上其X86指令集能跑Windows,做一些上網(wǎng)本、電腦盒子,是非常有希望進入商業(yè)市場的。
結(jié)語
從實踐上看,無論是技術(shù)引進CPU,還是自主路線CPU,在IPC上均有跨越式進步,都已經(jīng)跨入10/G門檻。5年前,10/G還是國產(chǎn)CPU的目標(biāo),不過5年的時間,10/G成為了國產(chǎn)CPU的及格線。由于單核性能對CPU和用戶體驗最為關(guān)鍵,鐵流對國產(chǎn)CPU與英特爾、AMD CPU單核性能做了對比和盤點。
總體來看,龍芯和兆芯已經(jīng)達到40分,國產(chǎn)ARM CPU稍遜一籌,單核成績在22-31分。相對于英特爾13代I3 單核(int)67分的成績,國產(chǎn)CPU尚有較大提升空間。
未來,比拼的重點在各家CPU的發(fā)展后勁,比拼的是技術(shù)能力和更新速度??紤]到大陸的制造工藝水平,如果采用12nm工藝的情況下,60分會是一個坎,如果采用5/7nm工藝,70分會是一個坎。當(dāng)國產(chǎn)CPU把單核性能提升到60-70分水平,也就是追平13代酷睿,這個性能已經(jīng)足以滿足3A游戲需求,屆時,國產(chǎn)CPU也會像英特爾那樣“擠牙膏”,會更重視降低功耗,降低芯片面積,降低CPU成本。
從國際大環(huán)境上看,由于俄烏和巴以沖突,美國在對外干涉上已經(jīng)比較乏力。只要臺海不爆發(fā)沖突,美國對華制裁的烈度在幾年內(nèi)不會超過前幾年。技術(shù)引進CPU再度發(fā)生“絕版”的概率偏低。在中美斗而不破的大環(huán)境下,引進CPU的風(fēng)險會大幅降低。這樣一來,國產(chǎn)CPU將進入比拼性能、價格、生態(tài)、服務(wù)的階段。
有鑒于幾家國產(chǎn)CPU均走上正軌,只要在更新2-3代,把單核性能提升到13/14代酷睿水平,把成本和價格壓下來,把軟件生態(tài)進一步豐富,5年后就希望依靠性價比侵蝕英特爾、AMD的市場份額。