“2005年,在一個(gè)演講中,有專業(yè)人士預(yù)判,設(shè)計(jì)芯片的驗(yàn)證工作量占比將來會(huì)超過70%,當(dāng)時(shí)我很震驚。但事實(shí)證明,這一年來,我們所有的合作伙伴、客戶在芯片驗(yàn)證領(lǐng)域所花的人力、物力已經(jīng)超過了70%。這是發(fā)展的歷史見證,當(dāng)芯片規(guī)模越來越大、設(shè)計(jì)越來越復(fù)雜、制程也越來越復(fù)雜,對(duì)于芯片的成功設(shè)計(jì)和生產(chǎn),驗(yàn)證工作變得彌足珍貴,直接關(guān)乎勝敗。” 西門子EDA全球副總裁兼中國(guó)區(qū)總經(jīng)理凌琳如是說。
的確,在過去20年時(shí)間里,驗(yàn)證的方法論,特別是硬件輔助驗(yàn)證,已經(jīng)成為EDA客戶的關(guān)注焦點(diǎn)。與此同時(shí),根據(jù)業(yè)界實(shí)踐數(shù)據(jù)顯示,采用硬件輔助驗(yàn)證的IC設(shè)計(jì)項(xiàng)目在首次硅片成功率(First Silicon Success)上有顯著提升,減少了大量的返工時(shí)間和成本。基于此,市場(chǎng)調(diào)研機(jī)構(gòu)預(yù)測(cè),2019-2024年間,硬件輔助驗(yàn)證市場(chǎng)的復(fù)合年增長(zhǎng)率(CAGR)預(yù)計(jì)超過10%。而未來,隨著AI、ML、大規(guī)模計(jì)算技術(shù)的持續(xù)發(fā)展,對(duì)硬件輔助驗(yàn)證市場(chǎng)的需求也會(huì)同步提升。
硬件輔助驗(yàn)證平臺(tái)是什么?
提到硬件輔助驗(yàn)證平臺(tái),可以參考AMD提出的三層解決方案空間觀點(diǎn),即硬件仿真加速、企業(yè)級(jí)原型驗(yàn)證、軟件原型驗(yàn)證。
圖 | 西門子EDA硬件輔助驗(yàn)證產(chǎn)品管理高級(jí)總監(jiān)Vijay Chobisa介紹三層解決方案空間
首先,我們來看硬件仿真加速,芯片設(shè)計(jì)團(tuán)隊(duì)需要有快速的編譯,用于設(shè)計(jì)的bring up、迭代和調(diào)試,并且循環(huán)往復(fù)地快速去做這項(xiàng)工作。由于在設(shè)計(jì)仿真的早期就需要用到硬件仿真加速,所以需要全信號(hào)可見,來實(shí)現(xiàn)快速的調(diào)試。
其次,我們來看企業(yè)級(jí)原型驗(yàn)證,當(dāng)我們的設(shè)計(jì)相對(duì)穩(wěn)定下來,不需要再去做頻繁的更改時(shí),就可以把驗(yàn)證的工作推進(jìn)到原型驗(yàn)證階段,包括早期的固件和嵌入式的軟件驗(yàn)證,從而實(shí)現(xiàn)在更長(zhǎng)的工作鏈路上看到整個(gè)軟件的工作量。
對(duì)于企業(yè)級(jí)原型驗(yàn)證而言,高度的一致性非常重要,這個(gè)一致指的是硬件仿真加速和企業(yè)級(jí)原型驗(yàn)證的一致性,也就是可以把整個(gè)硬件加速的結(jié)果轉(zhuǎn)換到企業(yè)級(jí)原型驗(yàn)證當(dāng)中,同時(shí)如果在原型驗(yàn)證中有一些具體的調(diào)試問題,也可以返回硬件仿真加速。
最后,我們來看軟件原型驗(yàn)證,這個(gè)主要是給軟件工程師使用的,換言之,系統(tǒng)軟件工程師可以在芯片還未流片前就能初步測(cè)試軟件的功能和性能表現(xiàn)。同時(shí),為了保持系統(tǒng)級(jí)驗(yàn)證,需要有高速接口和IP驗(yàn)證,以及靈活的配置,比如更改連接線,或人工更改分區(qū)等,達(dá)到以最低的成本實(shí)現(xiàn)最高的性能吞吐率。
根據(jù)與非網(wǎng)的觀察,當(dāng)前全球主要的硬件輔助驗(yàn)證市場(chǎng)企業(yè)包括西門子、Agnisys、Aldec、新思科技(ANSYS)、Blue Pearl Software、Cadence、EMA Design Automation、Hardent和Innovative Logic等,這些第一、第二梯隊(duì)的企業(yè)占據(jù)了大量的市場(chǎng)份額。
行業(yè)獨(dú)家,西門子同步發(fā)布三大硬件輔助驗(yàn)證系統(tǒng)平臺(tái)Veloce CS
作為全球硬件輔助驗(yàn)證市場(chǎng)中重要的平臺(tái)提供者,近日西門子數(shù)字化工業(yè)軟件推出 Veloce CS 硬件輔助驗(yàn)證和確認(rèn)系統(tǒng),該系統(tǒng)融合了硬件仿真、企業(yè)原型驗(yàn)證和軟件原型驗(yàn)證三大產(chǎn)品板塊:
- 用于硬件加速仿真的 Veloce Strato CS 硬件
- 用于企業(yè)原型驗(yàn)證的 Veloce Primo CS 硬件
- 用于軟件原型驗(yàn)證的 Veloce proFPGA CS 硬件
圖 | 西門子同時(shí)宣布新一代三大硬件輔助驗(yàn)證產(chǎn)品
隨著Veloce CS的推出,西門子也躍升為業(yè)界唯一擁有3個(gè)硬件系統(tǒng)平臺(tái)的公司,其他競(jìng)爭(zhēng)對(duì)手最多擁有其中1~2個(gè)硬件系統(tǒng)平臺(tái)。
事實(shí)上,如果大家對(duì)西門子的硬件輔助驗(yàn)證工具有所了解,可以看到2021年西門子曾推出Veloce硬件輔助驗(yàn)證系統(tǒng),該系統(tǒng)融合了虛擬平臺(tái)、硬件仿真和 FPGA 原型驗(yàn)證技術(shù)。所以今年推出的Veloce CS一方面是三年前Veloce的升級(jí),另一方面又通過收購(gòu)整合增加了軟件原型驗(yàn)證的平臺(tái)。
根據(jù)西門子EDA硬件輔助驗(yàn)證產(chǎn)品管理高級(jí)總監(jiān)Vijay Chobisa的介紹,Veloce CS相比Veloce的提升不是一丁半點(diǎn),包括速度提升了5-15倍,能耗減少了2倍,密度又提升了2倍。以硬件加速仿真產(chǎn)品為例,與上一代 Veloce Strato 相比,Veloce Strato CS 的硬件加速仿真性能顯著提高,最高可達(dá) 5 倍,同時(shí)還可保持完全的可觀測(cè)性,支持能力從 4000 萬門電路擴(kuò)展到超過 400 億門電路。
圖 | Veloce Strato CS + Veloce Primo CS,提供完整統(tǒng)一的硬件/軟件開發(fā)和驗(yàn)證平臺(tái)
他還提到,Veloce Strato CS和Veloce Primo CS出自同一個(gè)研發(fā)團(tuán)隊(duì),外部長(zhǎng)相一致,系統(tǒng)架構(gòu)一致,運(yùn)行環(huán)境一致,并能在不同平臺(tái)之間無縫移動(dòng),所以可以大大提升用戶在啟動(dòng)、設(shè)置、調(diào)試和工作負(fù)載執(zhí)行的速度。如果將其量化,Veloce Strato CS和Veloce Primo CS雙機(jī)運(yùn)行大約可提高6~10倍的生產(chǎn)力/收益。
此外,提到軟件原型驗(yàn)證平臺(tái),它的入門成本是非常低的,用戶可以根據(jù)自己的體量需求來制定小、中、大型的系統(tǒng)配置,小型的包括單塊FPGA和4塊FPGA的桌面級(jí)原型,中型和大型的則采用刀片式架構(gòu),可從6個(gè)FPGA擴(kuò)展至180個(gè)FPGA(6個(gè)為一個(gè)刀片,30個(gè)刀片即為180個(gè)FPGA),非常靈活。
自研芯片CrystalX+刀片系統(tǒng),實(shí)現(xiàn)從4000萬到400億的可拓展性
前面提到Veloce Strato CS擁有從 4000 萬門電路擴(kuò)展到超過 400 億門電路的能力,這是如何實(shí)現(xiàn)的呢?
有一點(diǎn)很重要,那就是整個(gè)Veloce CS平臺(tái)都采用了模塊化刀片配置,可以像搭建樂高積木一樣往上累加,不僅提高了系統(tǒng)電路能力的上限,還增加了靈活性,并在規(guī)模效應(yīng)中降低了成本。事實(shí)上,模塊化刀片配置在高性能計(jì)算市場(chǎng)是非常主流的一個(gè)趨勢(shì),尤其符合現(xiàn)代數(shù)據(jù)中心的占地要求、能耗要求以及冷卻要求。
除此之外,基礎(chǔ)硬件的升級(jí)也是Veloce CS性能表現(xiàn)突出的重要基礎(chǔ)。
據(jù)悉,Veloce Strato CS搭載了完全由西門子自主設(shè)計(jì)的專用加速器芯片——CrystalX,該芯片采用7nm制程工藝,疊加薄膜技術(shù)的創(chuàng)新和2.5D IC堆棧技術(shù),可以幫助客戶實(shí)現(xiàn)更加快速的可預(yù)測(cè)的編譯、設(shè)計(jì)、啟動(dòng)和迭代。
圖 | Veloce CS 系列產(chǎn)品的技術(shù)基礎(chǔ)
而Veloce Primo CS和Veloce proFPGA CS則均采用了AMD的自適應(yīng)FPGA產(chǎn)品——VP1902,這也是Veloce Primo CS和Veloce Strato CS在底層技術(shù)上的重要區(qū)別。
值得一提的是,由于CrystalX芯片里有一個(gè)邏輯分析器,所以Veloce Strato CS的調(diào)試性能會(huì)比Veloce Primo CS更好。
關(guān)于下一步西門子是否會(huì)考慮自研更多芯片,來替代AMD的FPGA應(yīng)用時(shí),Vijay Chobisa表示:“AMD既是西門子的供應(yīng)商,又是西門子的客戶,雙方合作非常緊密,而西門子暫時(shí)也還沒有計(jì)劃自研原型驗(yàn)證用的SoC或FPGA產(chǎn)品,來替代現(xiàn)有的這種高效組合?!?/p>
10億門容量,只要10千瓦能耗,是競(jìng)對(duì)的1/7~1/6
我們?cè)谇懊娴恼鹿?jié)提到了全球主要的硬件輔助驗(yàn)證市場(chǎng)企業(yè),那么如何來評(píng)判這些企業(yè)的產(chǎn)品在市場(chǎng)中的地位和特色呢?首先用戶的體驗(yàn)和反饋是首要的,另外在全球性推動(dòng)經(jīng)濟(jì)結(jié)構(gòu)綠色轉(zhuǎn)型的今天,能耗也是大家關(guān)注的焦點(diǎn)。
據(jù)悉,Veloce CS平臺(tái)使用的是風(fēng)冷系統(tǒng),不需要額外的液體或水的冷卻,所以在10億門的容量上大概需要10千瓦的能耗,與競(jìng)對(duì)產(chǎn)品相比,Veloce CS平臺(tái)的功耗是行業(yè)最低,僅從用電和冷卻方面就可節(jié)省數(shù)百萬美元。