日前,中國工程院院士許居衍在題為《復(fù)歸于道:封裝改道芯片業(yè)》的報(bào)告中指出,經(jīng)典的 2D 縮放已經(jīng)“耗盡”了現(xiàn)有的技術(shù)資源,現(xiàn)在通過節(jié)點(diǎn)實(shí)現(xiàn)性能翻番的方法已經(jīng)失靈。單片集成電路過去一向強(qiáng)調(diào) PPA,即更高的性能(erformance)、更低的功耗(Power)、更小的面積(Area)。這個(gè)邏輯方向到了需要修正的時(shí)候了!因此 3D 異質(zhì)集成、MCP(Multi-Chip Package 多芯片封裝)、SiP(System-in-Package)、PoP(Packaging on Packaging)等封裝技術(shù)成為走出 2D 同質(zhì)集成的契機(jī)。3D 異質(zhì)集成的基礎(chǔ)就是 IP 復(fù)用。許居衍院士在報(bào)告中非??春?3D 異質(zhì)集成技術(shù)的潛力。
?
什么是芯粒
近年來,芯粒(Chiplet)或成為半導(dǎo)體產(chǎn)業(yè)的熱門詞。在科研界和產(chǎn)業(yè)界看來,這是一種可以延緩摩爾定律失效、放緩工藝進(jìn)程時(shí)間、支撐半導(dǎo)體產(chǎn)業(yè)繼續(xù)發(fā)展的有效方案。
?
簡而言之,芯粒其實(shí)就是一顆商品化的、具有功能(如 USB、存儲器)特征的裸芯片(die)。從系統(tǒng)端出發(fā),首先將復(fù)雜功能進(jìn)行分解,然后開發(fā)出多種具有單一特定功能,可相互進(jìn)行模塊化組裝的裸芯片,如實(shí)現(xiàn)數(shù)據(jù)存儲、計(jì)算、信號處理、數(shù)據(jù)流管理等功能,并最終以此為基礎(chǔ),建立一個(gè)芯粒的芯片網(wǎng)絡(luò)(未來的電腦系統(tǒng)可能只包含一個(gè) CPU 芯片和幾個(gè) GPU,這些 GPU 都連接到芯粒上,形成芯片網(wǎng)絡(luò))。
?
以前設(shè)計(jì)一個(gè) SoC,是從不同的 IP 供應(yīng)商購買一些 IP,包括軟核(代碼)或硬核(版圖),結(jié)合自家研發(fā)的模塊,集合成一個(gè) SoC,然后在某個(gè)制造工藝節(jié)點(diǎn)上完成芯片設(shè)計(jì)和生產(chǎn)的完整流程。芯粒模式時(shí)代,對于某些 IP,可能不需要自己做設(shè)計(jì)和生產(chǎn)了,而只需要購買別人己經(jīng)做好的芯片裸片(die),然后通過先進(jìn)封裝形成一個(gè) SiP(System in Package)。所以芯粒也是一種 IP,但它是以芯片裸片的形式提供,而不是之前以軟件形式提供。
?
芯粒模式可能帶給從上游 EDA 工具、IC 設(shè)計(jì)到制造工藝、先進(jìn)封測等產(chǎn)業(yè)鏈環(huán)節(jié)顛覆式的創(chuàng)新革命。
?
芯粒發(fā)展現(xiàn)狀
理論上,芯粒模式是一種開發(fā)周期短且成本較低的方法,提供了先進(jìn)工藝和主流成熟工藝選擇的靈活性,可以將不同節(jié)點(diǎn)工藝(10nm、14/16nm 及 22nm)、不同材質(zhì)(硅、砷化鎵、碳化硅、氮化鎵)、不同功能(CPU、GPU、FPGA、RF、I/O、存儲器)、不同半導(dǎo)體公司的芯片封裝在一起。
?
目前,芯粒模式還處于發(fā)展早期,美國主要圍繞 DARPA 的 CHIPS(Common Heterogeneous Integration and IP Reuse Strategies,通用異構(gòu)集成和 IP 重用戰(zhàn)略)項(xiàng)目發(fā)展。在 CHIPS 項(xiàng)目中,有大型半導(dǎo)體企業(yè)如英特爾(Intel)、美光(Micron)等,有 EDA 工具開發(fā)企業(yè)如新思科技(Synopsys)、楷登電子(Candence),有大型防務(wù)公司諾斯羅普·格魯門(Northrop Grumman)、洛克希德·馬丁(Lockheed Martin)、波音(Boeing)等,還有高校如如密西根大學(xué)(University of Michigan)、佐治亞理工學(xué)院(Georgia Institute of Technology)、北卡羅萊納州立大學(xué)(North Carolina State University)。
?
2018 年 10 月,7 家公司成立 ODSA(Open Domain-Specific Architecture,開放專用域架構(gòu))組織,目前組織會員已超過 50 家,其目標(biāo)是制定芯粒開放標(biāo)準(zhǔn)、促進(jìn)形成芯粒生態(tài)系統(tǒng)、催生低成本 SoC 替代方案。換言之,就是將一系列模塊化芯片或 Chiplets,通過裸芯片和裸芯片(die-to-die)的互連方案封裝集成。
?
迄今為止,已經(jīng)有很多公司創(chuàng)建了自己的芯粒生態(tài)系統(tǒng)。
?
l 美滿電子?
美滿電子自創(chuàng)始人周秀文(Sehat Sutardja)博士在 ISSCC 2015 上提出 MoChi(Modular Chip,模塊化芯片)架構(gòu)的概念以來,推出了一系列 Virtual SoC 產(chǎn)品,MoChi 可以是許多應(yīng)用的基準(zhǔn)架構(gòu),包括物聯(lián)網(wǎng)、智能電視、智能手機(jī)、服務(wù)器、筆記本電腦、存儲設(shè)備等。
?
圖片來源:ISSCC & Marvell
?
但遺憾的是,隨著創(chuàng)始人周秀文卸任 CEO,已經(jīng)很久沒有聽到 MoChi 相關(guān)的新消息。
?
l 賽靈思?
2017 年 Xilinx 在 HotChip 發(fā)布第四代堆疊方案 VU3xP,2018 年推出包含 3 個(gè) 16 納米的 FPGA 和 2 個(gè) DRAM 的首款采用 CCIX 接口的芯片,旨在從裸芯片層面證明 CCIX 能夠支持多核高性能 Arm CPU 和 FPGA 加速器實(shí)現(xiàn)一致性互聯(lián)。
?
l 超微半導(dǎo)體?
AMD 推出使用芯粒技術(shù)生產(chǎn)的代號為“羅馬 Rome”的第二代霄龍 EYPC Zen2 架構(gòu) CPU 芯片,內(nèi)部最多八個(gè) 7nm CPU 裸芯片和一個(gè) 14nm I/O 裸芯片,其中前者只有 CPU 核心、各級緩存和 Infinity Fabric 總線端口,得益于新工藝可以獲得更小面積、更強(qiáng)性能、更低功耗。后者專門獨(dú)立出來,集成輸入輸出、內(nèi)存控制器、PCIe 控制器和 Infinity Fabric 總線端口,可以更方便、更高效地處理各個(gè) CPU 核心、不同處理器的互連,而工藝之所以采用 14nm,是因?yàn)樗鼘π鹿に嚥幻舾?,老工藝則更加成熟,成本也更低,符合不同 IP 采用最合適工藝的 Chiplet 設(shè)計(jì)原則。
?
?
據(jù)悉,AMD 還將推出使用芯粒技術(shù)生產(chǎn)的代號為“米蘭 Milan”的第三代霄龍 EYPC Zen3 架構(gòu) CPU 芯片,內(nèi)部將集成 15 個(gè)裸芯片,比第二代多出 6 個(gè)裸芯片。
?
l 英特爾?
英特爾針對互聯(lián)標(biāo)準(zhǔn)的挑戰(zhàn),首先提出了高級接口總線(Advanced Interface Bus,AIB)標(biāo)準(zhǔn)。在 DARPA 的 CHIPS 項(xiàng)目中,英特爾將 AIB 標(biāo)準(zhǔn)開放給項(xiàng)目中的企業(yè)使用,旨在推動芯粒標(biāo)準(zhǔn)。AIB 是一種時(shí)鐘轉(zhuǎn)發(fā)并行數(shù)據(jù)傳輸機(jī)制,類似于 DDR DRAM 接口。目前,英特爾免費(fèi)提供 AIB 接口許可,以支持廣泛的芯粒生態(tài)系統(tǒng),包括設(shè)計(jì)方法或服務(wù)供應(yīng)商、代工廠、封裝廠和系統(tǒng)供應(yīng)商。此舉將加速 AIB 標(biāo)準(zhǔn)的快速普及,有望在未來成為類似 ARM 的 AMBA 總線的業(yè)界標(biāo)準(zhǔn)。
?
英特爾在 2014 年公布 EMIB(Embeded Multi-Die Interconnect Bridge:嵌入式多硅片互聯(lián))技術(shù)的基礎(chǔ)上,于 2018 年底,更是將其升級為邏輯晶圓 3D 堆疊技術(shù),命名為 Foveros。使用 Foveros 技術(shù),在二維平面上可以通過 EMIB 實(shí)現(xiàn)裸芯片之間的互聯(lián),在三維垂直方向上還可以使用 TSV(Through Silicon Via)實(shí)現(xiàn)裸芯片之間的堆疊。每個(gè)裸芯片所使用的工藝制程可以不一樣,通過高級封裝技術(shù)進(jìn)行封裝,充分利用 2D 和 3D 的空間。
?
EMIB 技術(shù)已經(jīng)在英特爾的 Stratix 10 FPGA 芯片上使用了,在未來英特爾的 CPU/FPGA/GPU/AI 等芯片上,我們可以期待 Foveros 技術(shù)的進(jìn)一步落地。Foveros 結(jié)合 EMIB 可以滿足各種不同應(yīng)用、功率范圍和外形尺寸的需求,提供低成本、高性能芯片選擇。英特爾預(yù)計(jì)將于 2019 年下半年推出一系列采用 Foveros 技術(shù)的產(chǎn)品。首款 Foveros 產(chǎn)品將整合高性能 10nm 模塊芯片和低功耗的 22nm 基礎(chǔ)晶片。
?
2019 年英特爾更是推出 Co-EMIB 技術(shù),這是 2D EMIB 技術(shù)的升級版,能夠?qū)蓚€(gè)或多個(gè) Foveros 芯片互連,實(shí)現(xiàn)更高的計(jì)算性能和數(shù)據(jù)交換能力,還能夠以非常高的帶寬和非常低的功耗連接模擬器、內(nèi)存和其他模塊,基本達(dá)到單晶片性能。
?
l 臺積電?
在 2019 年 6 月初于日本京都舉辦的 VLSI Symposium 期間,臺積電展示了自行設(shè)計(jì)的一顆芯粒“This”。采用 7nm 工藝,面積僅僅 27.28 平方毫米(4.4 毫米 x6.2 毫米),采用 CoWos(晶圓級封裝)。
?
圖片來源:網(wǎng)絡(luò)
?
采用雙芯片結(jié)構(gòu),可以通過添加額外的 PHY 來進(jìn)行擴(kuò)展,芯片不同單元間以及不同芯片之間可以形成互聯(lián)。其一內(nèi)置 4 個(gè) Cortex A72 核心,另一內(nèi)置 6MiB 三緩。標(biāo)稱最高主頻為 4GHz,實(shí)測最高居然達(dá)到了 4.2GHz(1.375V)。臺積電稱,這款芯片是為高性能計(jì)算平臺設(shè)計(jì)。
?
與此同時(shí),臺積電還開發(fā)了新型互連技術(shù) LIPINCON,每平方毫米 Shoreline 帶寬密度可以達(dá)到 67Gbps,針腳速度會達(dá)到 8.0Gbps,物理層的能耗效率是 0.56pJ/b。預(yù)估 2020 年技術(shù)落地。
?
l 極戈科技?
極戈科技主打快速芯片設(shè)計(jì)和制造,提出了一個(gè)稱為 ZiP 的集成平臺,通過獨(dú)特的“電路設(shè)計(jì)+封裝+ SDK+算法”,他們利用 SaaS 的模式提供芯片設(shè)計(jì)方案,也采用 2.5D/3D 封裝技術(shù)?;A(chǔ)芯片是極戈技開發(fā)的硅基芯片,上層是第三方的模塊芯片,包括傳感器、通訊、存儲等,從而低成本、高速度地實(shí)現(xiàn)小體積,低功耗的系統(tǒng)集成。極戈科技采用 Chiplet 模式極大地縮短了物聯(lián)網(wǎng)芯片的研發(fā)周期,能夠?qū)⑽锫?lián)網(wǎng)芯片的設(shè)計(jì)制造流程從超過 1 年壓縮到 2-4 周。?
?
圖片來源:極戈科技官網(wǎng)
?
國內(nèi)在系統(tǒng)集成方面也取得了不錯(cuò)的成績:
長電科技是中國營收規(guī)模最大的封裝公司,在先進(jìn)封裝技術(shù)和規(guī)模化量產(chǎn)能力中保持領(lǐng)先,在 eWLB、FO、WLCSP、BUMP、ECP、PoP、SiP、PiP 等封裝技術(shù)已有多年的經(jīng)驗(yàn)與核心專利的保護(hù),對于 Chiplet 的發(fā)展也已奠定了應(yīng)對的基礎(chǔ)。
?
華進(jìn)半導(dǎo)體成功開發(fā)小孔徑 TSV 工藝,進(jìn)而研發(fā)成功轉(zhuǎn)接板成套工藝,并且可基于中道成熟工藝實(shí)現(xiàn)量產(chǎn),實(shí)現(xiàn)多顆不同結(jié)構(gòu)或不同功能的芯片系統(tǒng)集成。TSV 直徑小,間距很密,可以實(shí)現(xiàn)高密度芯片封裝。芯片與芯片之間的互連通過平面內(nèi)的線路來實(shí)現(xiàn),可以重新分布電源、接地和信號引腳,這些電學(xué)信號可以通過 TSV,在底部進(jìn)行信號輸入和輸出,從而明顯降低輸入輸出引腳數(shù)量。功能芯片無需改變現(xiàn)有的結(jié)構(gòu)和設(shè)計(jì),與不同芯片組合搭配,具有很高的靈活度和集成度,適合對尺寸有嚴(yán)苛要求的高頻高速的電子產(chǎn)品。所有的芯片和互連線被密封,只有幾個(gè)端口裸露在外,整個(gè)系統(tǒng)有更好的密封性和可靠性。同時(shí),轉(zhuǎn)接板還可以進(jìn)行散熱設(shè)計(jì),來進(jìn)行熱管理。
?
圖片提供:華進(jìn)半導(dǎo)體
?
華天科技開發(fā)成功埋入硅基板扇出型 3D 封裝技術(shù),該技術(shù)利用 TSV 作為垂直互聯(lián),可以進(jìn)行異質(zhì)芯片三維集成,互連密度可以大大高于目前的臺積電 InFO 技術(shù)。工藝已經(jīng)開發(fā)完成,與國際客戶進(jìn)行的產(chǎn)品開發(fā)進(jìn)展順利。
?
埋入硅基板扇出型 3D 封裝結(jié)構(gòu)示意圖(圖片提供:華天科技)
?
通富微電在先進(jìn)封裝技術(shù)上積極耕耘。公司擁有 wafer level 先進(jìn)封裝技術(shù)平臺(WLCSP、Cu pillar wafer bumping,solder wafer bumping,Au wafer bumping),也擁有 wire bond + FC 的 hybrid 封裝技術(shù),還成功開發(fā)了 chip to wafer、Fan-out WLP、Fan-out wafer bumping 技術(shù)。公司瞄準(zhǔn) 5G 時(shí)代的大數(shù)據(jù)、云計(jì)算、數(shù)據(jù)低延遲要求特點(diǎn),正積極開發(fā)用于高性能計(jì)算(HPC)的 2.5D interposer 高端封裝技術(shù)。
芯粒的未來
?SoC(系統(tǒng)級芯片)的集成度越來越高,先進(jìn)工藝制程的芯片研發(fā)成本和制造成本呈幾何級倍數(shù)不斷攀升。過去,設(shè)計(jì)一款 28 納米芯片的研發(fā)成本約為 5000 萬美元,7 納米的研發(fā)成本上漲到 3 億美元,而未來 3 納米芯片的研發(fā)成本將達(dá)到令人咂舌的 15 億美元之巨。已經(jīng)很少有 Fabless 公司,能夠承受得起這么昂貴的前期投入了。
?
數(shù)據(jù)來源:International Business Strategies, Inc.
?
隨著芯片制程從 10nm7nm 到 5nm 再到未來的 3nm,每一次制程縮減所需要的成本和開發(fā)時(shí)間都在大幅提升。而且,當(dāng)芯片制程接近 1nm 時(shí),就將進(jìn)入量子物理的世界,現(xiàn)有的工藝制程會受到量子效應(yīng)的極大影響。而先進(jìn)的工藝的玩家越來越少,10 納米以下玩家未來可能只有臺積電、三星電子(Samsung)、英特爾、中芯國際(SMIC)。
?
一切都表明后摩爾定律時(shí)代確已降臨。產(chǎn)業(yè)界確實(shí)有了很多變化。
?
許居衍院士在報(bào)告中還指出,后摩爾時(shí)代的單片同質(zhì)集成向三維多片異構(gòu)封裝集成技術(shù)“改道”是重要趨勢,因?yàn)槿S多片異構(gòu)封裝可以提供更高的帶寬、更低的功率、更低的成本和更靈活的形狀因子。當(dāng)前,ODSA 組織正在制定定芯粒開放標(biāo)準(zhǔn)、促進(jìn)形成芯粒生態(tài)系統(tǒng)、 催生低成本 SoC 替代方案,在不久的將來,產(chǎn)呂公司就可以根據(jù)需求靈活選擇來自多個(gè)供應(yīng)商的最佳芯粒,因此,降低了單片 SoC 高 NRE 的挑戰(zhàn),贏得快速上市時(shí)間的好處。許居衍院士還表示,芯粒的搭積木模式集工藝選擇、架構(gòu)設(shè)計(jì)、商業(yè)模式三大靈活性于一體,有助力活躍創(chuàng)新,可以推動微系統(tǒng)的發(fā)展、推進(jìn)芯片架構(gòu)創(chuàng)新、加快系統(tǒng)架構(gòu)創(chuàng)新、加速 DSA/DSL 發(fā)展、推動可重構(gòu)計(jì)算的發(fā)展和軟件定義系統(tǒng)發(fā)展。
?
巧合的是,中芯國際聯(lián)合首席執(zhí)行官趙海軍博士在日前的題為《立足中國,布局未來,迎接集成電路產(chǎn)業(yè)新發(fā)展》的報(bào)告中同樣看好芯粒模式。他在報(bào)告中表示,摩爾定律紅利剩下的節(jié)點(diǎn)不多了,但系統(tǒng)的復(fù)雜度需求仍將按原來的軌道繼續(xù)走下去,多出來的部分功能放在另外的芯片里,然后類似積木一樣拼接堆疊起來,循環(huán)往復(fù),以至無窮;同時(shí)工藝技術(shù)的學(xué)習(xí)曲線成本太高,把一個(gè)大芯片分成幾個(gè)小芯片來生產(chǎn),可以避免裸芯片的尺寸繼續(xù)增大,各個(gè)裸芯片可以使用不同的最佳工藝,使得良率大大提高,提前完成升級換代;而且新一代大芯片全覆蓋開發(fā)成本太高,重復(fù)使用原有節(jié)點(diǎn)設(shè)計(jì)的 IP,可以有效節(jié)省費(fèi)用和加快上市時(shí)間;但是,不同人獨(dú)立設(shè)計(jì)的單芯片,如 CPU 和存儲器,在組合的時(shí)候性能損失嚴(yán)重,就像限速和紅燈使得寶馬車和豐田車跑得一樣慢 ,所以需要多芯片組合的歸一化設(shè)計(jì)。因?yàn)椴煌男玖P枰獏f(xié)同設(shè)計(jì),通過同一個(gè)設(shè)計(jì)師或者使用同一個(gè)通信 IP,而產(chǎn)品公司不愿意讓一家晶圓代工公司把所有的芯粒都做了,所以不會全盤采用晶圓代工公司提供的 IP 方案,從而為封裝代工公司提供了機(jī)會,未來封裝代工公司可以提供更多的公用 IP 來支撐芯粒模式。
?
而剛于 2019 年 7 月正式加入武漢弘芯的前臺積電共同運(yùn)營官蔣尚義也表示,美國 DARPA 推動的電子產(chǎn)業(yè)振興計(jì)劃(ERI)推動芯粒模式,開始啟動主導(dǎo)標(biāo)準(zhǔn),蔣尚義建議國內(nèi)建立本土一套自己的芯粒標(biāo)準(zhǔn),促進(jìn)中國實(shí)現(xiàn)自己的標(biāo)準(zhǔn)。
?
芯粒模式的挑戰(zhàn)?
許居衍院士在報(bào)告中強(qiáng)調(diào),芯粒模式成功的關(guān)鍵在于芯粒的標(biāo)準(zhǔn)和接口。作為一種創(chuàng)新,芯粒模式存在多種挑戰(zhàn)。
?
首先是來自技術(shù)層面。芯粒的組裝或封裝尚缺乏統(tǒng)一的標(biāo)準(zhǔn)。目前各大玩家都有自家的方案,盡管各家的名稱不同,但歸總離不開硅通孔、硅橋和高密度 FO 技術(shù),不管是裸片堆疊還是大面積拼接,都需要將互連線將變得更短,要求互連線做到 100%的無缺陷,否則整個(gè)芯片無法工作。
?
其次是質(zhì)量保障問題。相對傳統(tǒng)軟 IP,芯粒是經(jīng)過硅驗(yàn)證的裸芯片,可以保證物理實(shí)現(xiàn)的正確性。但如果其中的一個(gè)裸芯片有問題,則整個(gè)系統(tǒng)都會受影響,代價(jià)很高。因此要保證芯粒 100%無故障。當(dāng)然這其中也包括集成后的測試,封裝后,可能有部分芯??赡芡耆珶o法直接從芯片外部管腳直接訪問,給芯片測試帶來的新的挑戰(zhàn)。
?
第三就是散熱問題。幾個(gè)甚至數(shù)十個(gè)裸芯片封裝在一個(gè)有限的空間中,互連線非常短,讓散熱問題變得更為棘手。
?
第四是芯片網(wǎng)絡(luò)問題。盡管每個(gè)芯粒本身設(shè)計(jì)不會發(fā)生死鎖,其通信系統(tǒng)都可以很好地工作,但是當(dāng)它們?nèi)窟B接在一起形成芯片網(wǎng)絡(luò)時(shí),就可能出現(xiàn)了交通死鎖與流量堵塞問題。超微半導(dǎo)體研究人員最近提出一種消除死鎖難題的方案,如果能夠徹底解決死鎖問題,那么芯粒將為未來計(jì)算機(jī)設(shè)計(jì)的發(fā)展帶來新的動力。
?
第五是供應(yīng)鏈重塑問題。在芯粒模式下,EDA 工具提供商、芯片提供商、封測提供商都要有所改變。比如芯粒模式中出現(xiàn)的問題可能最終都需要通過 EDA 工具的改進(jìn)來給出答案,需要 EDA 工具從架構(gòu)探索、到芯片實(shí)現(xiàn)、甚至到物理設(shè)計(jì)提供全面支持。還有來自不同的芯片提供商的裸芯片進(jìn)入封裝提供商工廠的進(jìn)度同步問題。
?
誰將笑到最后
好比撲克游戲,“摜蛋”是在原有的撲克游戲 “跑得快”和“八十分”基礎(chǔ)上發(fā)展演化而來,摜蛋的最大魅力在于牌際組合間的變數(shù),新手往往先把牌配死,并擬好出牌計(jì)劃,然后守株待兔,這是初級階段的呆板打法,完美的靜態(tài)組合加上動態(tài)變化才是取勝之道。
?
芯粒模式就是一個(gè)新牌局,芯粒模式及其商業(yè)化還在探索中,商業(yè)模式創(chuàng)新可能會帶來新的出路。
?
芯片設(shè)計(jì)公司可以將自家的芯片以 IP 方式提供,IP 供應(yīng)商可以將軟核以硬核的方式提供,芯片制造商和封裝測試供應(yīng)商可以提供整體的封裝方案,分銷商也可以提供進(jìn)行芯片整合。甚至某些天才工程師完全可以成立獨(dú)立設(shè)計(jì)工作室,去做自己擅長的特定功能芯片,然后以芯粒模式出售給芯片產(chǎn)品公司。
?
封裝進(jìn)入新階段,笑看天下風(fēng)云起。芯粒模式將極大改變封裝業(yè)的格局,進(jìn)而改變整個(gè)芯片產(chǎn)業(yè)格局。