2023 年,生成式 AI 如同當(dāng)紅炸子雞,吸引著全球的目光。當(dāng)前,圍繞這一領(lǐng)域的競爭愈發(fā)白熱化,全球陷入百模大戰(zhàn),并朝著千模大戰(zhàn)奮進(jìn)。在這場潮流中,AI 芯片成為支撐引擎,為大模型應(yīng)用提供強(qiáng)有力的支持。蓬勃發(fā)展的大模型應(yīng)用所帶來的特殊性需求,正推動(dòng)芯片設(shè)計(jì)行業(yè)邁向新紀(jì)元。眾多頂級的半導(dǎo)體廠商紛紛為大模型應(yīng)用而專門構(gòu)建 AI 芯片,其高算力、高帶寬、動(dòng)輒千億的晶體管數(shù)量成為大芯片的標(biāo)配。
芯片設(shè)計(jì)復(fù)雜度,邁向新高峰
在人工智能領(lǐng)域,大模型應(yīng)用的興起,讓芯片的發(fā)展來到了一個(gè)新高度。大模型應(yīng)用需要處理大規(guī)模的數(shù)據(jù),以 OpenAI 的 ChatGPT 從第一代大約 50 億個(gè)參數(shù),發(fā)展到 GPT4.0 大約將超過 1T 的參數(shù),對算力的高需求不必多說。此外,HBM 作為一種高性能內(nèi)存解決方案被各大芯片廠商引入。與此同時(shí),先進(jìn)封裝技術(shù)如 CoWoS 成為 GPU 的主流選擇,先進(jìn)封裝技術(shù)與 HBM 是一對無法忽視的組合,通過多芯片堆疊提高了芯片之間的通信速度和能效,為大模型應(yīng)用提供強(qiáng)有力的支持。
Chiplet 技術(shù)被認(rèn)為是后摩爾時(shí)代繼續(xù)提高算力密度的重要技術(shù)之一,也獲得了大模型 AI 芯片的青睞。Chiplet 技術(shù)將芯片分割成更小的模塊,使得芯片可以采用異構(gòu)設(shè)計(jì),即不同的模塊可以由不同制造商提供,這為芯片設(shè)計(jì)帶來更大的靈活性和創(chuàng)新空間。Chiplet 技術(shù)正在改變半導(dǎo)體行業(yè),其應(yīng)用前景潛力無限。根據(jù)研究機(jī)構(gòu) Omdia 報(bào)告,2024 年采用 Chiplet 的處理器芯片的全球市場規(guī)模將達(dá) 58 億美元,到 2035 年將達(dá)到 570 億美元。
大模型應(yīng)用背后的芯片設(shè)計(jì)顯示了一個(gè)明顯的趨勢:芯片不再是簡單的集成電路,而是一個(gè)多維交織的產(chǎn)物,包含著全新的架構(gòu)設(shè)計(jì)、創(chuàng)新的互聯(lián)方式以及先進(jìn)封裝技術(shù)等等。
然而,芯片設(shè)計(jì)行業(yè)的挑戰(zhàn)并不僅限于大模型應(yīng)用的迅速發(fā)展。智能手機(jī)、物聯(lián)網(wǎng)設(shè)備、自動(dòng)駕駛汽車等應(yīng)用市場的發(fā)展,各個(gè)領(lǐng)域?qū)π酒囊笤絹碓礁?,因此,半?dǎo)體設(shè)計(jì)和制造商必須利用更精密和復(fù)雜的設(shè)計(jì)方法來滿足這些新的需求。
在消費(fèi)電子領(lǐng)域,許多移動(dòng)和手持設(shè)備對低功耗的要求十分迫切。為了實(shí)現(xiàn)低功耗設(shè)計(jì)目標(biāo),芯片設(shè)計(jì)商不得不采用先進(jìn)的低功耗技術(shù),包括電源關(guān)斷技術(shù)(PSO)、多供電電壓(MSV)以及動(dòng)態(tài)電壓頻率縮放(DVFS)等技術(shù)。
在汽車行業(yè),為了滿足現(xiàn)代汽車“電動(dòng)化,網(wǎng)聯(lián)化,智能化,共享化”四化發(fā)展的需求,汽車中所需的處理器日益強(qiáng)大,對安全性的要求也越來越高。然而,高性能處理器也帶來了更高的安全風(fēng)險(xiǎn)。因此,必須對這些處理器的設(shè)計(jì)和實(shí)施進(jìn)行更嚴(yán)格的測試和驗(yàn)證。
仿真,解決復(fù)雜芯片驗(yàn)證挑戰(zhàn)的先鋒
隨著各類應(yīng)用對芯片提出了新需求,芯片設(shè)計(jì)的復(fù)雜性正在以前所未有的速度遞增,這不僅引發(fā)了試錯(cuò)成本的急劇膨脹,也給驗(yàn)證工作帶來了嚴(yán)峻的挑戰(zhàn)。
晶體管數(shù)量的急劇攀升,新架構(gòu)新設(shè)計(jì)的引入,設(shè)計(jì)師面臨的驗(yàn)證場景越加豐富,考慮的影響因素也持續(xù)擴(kuò)大。例如,新興的 Chiplet 設(shè)計(jì)方法帶來了全新的驗(yàn)證和調(diào)試挑戰(zhàn):設(shè)計(jì)師必須保證各模塊在組合后能夠無縫協(xié)作,一旦出現(xiàn)了錯(cuò)誤,需要在問題調(diào)試時(shí)準(zhǔn)確定位問題源頭。
在最終決定流片前,進(jìn)行全方位的功能驗(yàn)證和性能評估,消弭所有潛在的瑕疵和隱患,是避免在后期生產(chǎn)階段承受巨額損失的決定性因素。在應(yīng)對這種日益增長的驗(yàn)證復(fù)雜性的戰(zhàn)斗中,仿真器的角色正在被賦予越來越重大的價(jià)值和期待。
仿真器作為驗(yàn)證芯片設(shè)計(jì)功能和性能的工具,為芯片設(shè)計(jì)人員提供了模擬電路運(yùn)行的虛擬環(huán)境,幫助預(yù)測和解決潛在問題,避免錯(cuò)誤進(jìn)入實(shí)際制造流程,從而節(jié)省時(shí)間和成本。仿真器,將成為解決復(fù)雜芯片設(shè)計(jì)諸多挑戰(zhàn)的先鋒。
隨著新技術(shù)的涌現(xiàn),為了滿足不斷增長的驗(yàn)證需求,仿真工具需要提供高效的仿真性能,積極探索和引入新技術(shù),如硬件加速和機(jī)器學(xué)習(xí),從而提高驗(yàn)證的效率和準(zhǔn)確性。此外,仿真工具還需要具備良好的可擴(kuò)展性,能夠處理大規(guī)模設(shè)計(jì),支持并行計(jì)算和分布式仿真。
迎接新技術(shù)挑戰(zhàn),仿真實(shí)現(xiàn)再進(jìn)化
提到仿真,就不得不說一下 EDA 行業(yè)的巨頭 Cadence。從上世紀(jì) 80 年代中后期開始,Cadence 就創(chuàng)造性地推出了 Verilog 語言,為數(shù)字電路設(shè)計(jì)師提供了一種描述和驗(yàn)證電路行為的標(biāo)準(zhǔn)語言,極大地提高了設(shè)計(jì)的效率和準(zhǔn)確性。Cadence 甚至將 Verilog 語言免費(fèi)提供給業(yè)界使用,進(jìn)一步推動(dòng)了數(shù)字電路設(shè)計(jì)的進(jìn)步。
而如今,Cadence 的 Xcelium Logic Simulator 仿真器可望成為復(fù)雜芯片驗(yàn)證的一大得力助手。這款仿真器不僅擁有卓越的高性能和大容量,還支持多種語言類型,包括 SystemVerilog、VHDL、SystemC、e、UVM 和 IEEE UPF 標(biāo)準(zhǔn)。通過充分利用約束信息、約束性能分析和調(diào)試功能,Xcelium 仿真器在 IP 層面的驗(yàn)證實(shí)現(xiàn)了顯著的速度提升,為新一代芯片設(shè)計(jì)注入了強(qiáng)大動(dòng)力。
Xcelium Logic Simulator 利用其并行和增量構(gòu)建技術(shù),顯著減少構(gòu)建時(shí)間、降低編譯內(nèi)存占用和減少設(shè)計(jì)所需的存儲空間。此外,Xcelium 擁有市場上領(lǐng)先的一站式前端編譯器,覆蓋軟件至硬件仿真的整個(gè)驗(yàn)證流程。再者,Xcelium 運(yùn)用的多核引擎,為時(shí)間消耗長的測試項(xiàng)目帶來速度提升。其先進(jìn)的保存/恢復(fù)技術(shù),使其能支持?jǐn)?shù)字和實(shí)數(shù)仿真,以及模擬混合信號仿真。Xcelium 更配備了動(dòng)態(tài)測試加載、約束求解器優(yōu)化和多線程并行處理等功能,提升仿真效率。
Xcelium 絕妙之處在于它在 Xcelium Logic Simulator 的原生引擎實(shí)現(xiàn)了一些列有益的延伸,其中包括機(jī)器學(xué)習(xí)、功能安全、多核、混合信號、功耗回放、X-Pessimism Removal 等,這六大 Apps 組合幾乎涵蓋了設(shè)計(jì)和驗(yàn)證周期中的各種技術(shù),可謂是包羅萬象。
舉例來說,在芯片設(shè)計(jì)過程中,設(shè)計(jì)驗(yàn)證工程師常常要加班加點(diǎn)運(yùn)行無數(shù)次回歸,為實(shí)現(xiàn)覆蓋率目標(biāo)耗費(fèi)心神,即使在驗(yàn)證方面投入非常大的人力和時(shí)間,流片時(shí)出現(xiàn)功能失效的風(fēng)險(xiǎn)也很高。針對這一問題,Xcelium 的機(jī)器學(xué)習(xí) App(Xcelium Machine Learning)引入了 Cadence 專有的機(jī)器學(xué)習(xí)技術(shù),它不僅能加速覆蓋收斂,還可從以往的回歸運(yùn)行中學(xué)習(xí)并指導(dǎo) Xcelium 隨機(jī)引擎,在實(shí)現(xiàn)相同覆蓋率的前提下大幅度減少仿真次數(shù),最多可以減少十倍,或者是在特定的覆蓋點(diǎn)產(chǎn)生激勵(lì)以便發(fā)現(xiàn)更多的漏洞。通過減少仿真次數(shù)和更精準(zhǔn)的測試激勵(lì),工程師們可以更加專注于發(fā)現(xiàn)和解決設(shè)計(jì)中的問題,而不是被重復(fù)的回歸運(yùn)行所困擾。
Xcelium ML 流程
再比如,針對汽車中的功能安全,Cadence 的 Xcelium 是市面上唯一一款在主引擎中啟用并發(fā)注入的仿真器,Xcelium Safety App 能夠同時(shí)支持串行和并行故障仿真。結(jié)合 Jasper Safety、vManager Safety 和 Midas Safety Planner 等 Cadence 安全驗(yàn)證全流程工具,Xcelium 能夠高效地執(zhí)行安全錯(cuò)誤注入,以滿足 ISO26262 標(biāo)準(zhǔn)的要求。此外,Cadence 提供了廣泛的汽車功能安全文檔套件,涵蓋了半導(dǎo)體設(shè)計(jì)和驗(yàn)證的全譜系。該套件大大減少了供應(yīng)商在每個(gè)汽車設(shè)計(jì)項(xiàng)目中進(jìn)行工具用例評估的工作量,并幫助他們避免昂貴的工具認(rèn)證工作。
符合 ISO 26262 標(biāo)準(zhǔn)的 Cadence Xcelium 故障模擬解決方案
而對于想要走 Chiplet 路線的芯片公司,Xcelium 的多核應(yīng)用(Multi-Core App)是一個(gè)高度可擴(kuò)展的用于加速門級仿真的解決方案。它自動(dòng)將芯片設(shè)計(jì)分解成若干個(gè)獨(dú)立的部分,并在服務(wù)器的并行內(nèi)核上對其進(jìn)行仿真,從而大大縮短了 SystemVerilog 設(shè)計(jì)的仿真用時(shí),尤其適用于大規(guī)模設(shè)計(jì)。
結(jié)語
總的來說,我們正處在芯片行業(yè)的一個(gè)變革時(shí)期,創(chuàng)新和速度是成功的關(guān)鍵。新技術(shù)的快速發(fā)展和新需求的持續(xù)涌現(xiàn),使得芯片設(shè)計(jì)的復(fù)雜度呈現(xiàn)指數(shù)級增長。而在這個(gè)過程中,如何提高生產(chǎn)效率,如何縮短產(chǎn)品上市時(shí)間,這都是設(shè)計(jì)工程師面臨的挑戰(zhàn)。仿真器的介入,將是芯片廠商們探索新技術(shù)、解決復(fù)雜芯片設(shè)計(jì)難題的得力工具。
相信在 Xcelium Logic Simulator 及多種 Apps 組合,大小型芯片公司都能夠更自信地迎接新一代芯片設(shè)計(jì)過程中的復(fù)雜性挑戰(zhàn),快速推進(jìn)設(shè)計(jì)驗(yàn)證,將創(chuàng)新產(chǎn)品迅速推向市場,朝著更高、更遠(yuǎn)的未來邁進(jìn)。