“SoC FPGA 已經(jīng)進(jìn)入 4 核乃至 16 核時(shí)代,集成有 500 多萬個(gè)邏輯單元,DSP 的浮點(diǎn)運(yùn)算能力達(dá)到 10T FLOPS,面臨的一個(gè)關(guān)鍵的問題是這些數(shù)據(jù)如何快速傳輸?shù)胶诵奶幚韱卧?因此存儲器的訪問越顯重要。我們推出的最新解決方案就是這樣一種能夠?qū)崿F(xiàn) 10 倍于此前的存儲器帶寬的產(chǎn)品,這是一個(gè)蛙跳式的進(jìn)步?!盇ltera 公司產(chǎn)品營銷資深總監(jiān) Patrick Dorsey 在其最新產(chǎn)品 Stratix 10 DRAM SiP 的發(fā)布會上如是說。
具體來說,這款計(jì)劃于 2017 年出貨的最新的 Stratix 10 DRAM SiP 產(chǎn)品將采用存儲器廠商現(xiàn)代公司的 HBM DRAM 內(nèi)存,通過英特爾先進(jìn)的嵌入式多裸片互連橋接(EMIB)技術(shù),將 FPGA、MCU、DSP 以及 DRAM 等其他功能模塊集成在 2.5D 的 SiP 封裝內(nèi),實(shí)現(xiàn)一個(gè)異構(gòu)多核的 SoC FPGA 產(chǎn)品。
這里面包含幾個(gè)關(guān)鍵的信息點(diǎn),即:
1. Altera 在 SoC FPGA 產(chǎn)品中劃時(shí)代的開始采用 DRAM 存儲器,而且是最新的 HBM 內(nèi)存,將 FPGA 的存儲器帶寬提升了 10 倍,對 Stratix 10 系列面向的包括數(shù)據(jù)中心、HPC、雷達(dá)、定制服務(wù)器等高端市場而言,具有里程碑式的意義;
一些 Stratix 10 的目標(biāo)市場對系統(tǒng)帶寬的要求
2. 此次 DRAM 內(nèi)存的集成是通過英特爾獨(dú)有的 EMIB 技術(shù)實(shí)現(xiàn)的,這種技術(shù)適用于 14nm 工藝,是介于傳統(tǒng)平面、最新立體晶體管技術(shù)之間的一種 2.5D 封裝格式,能在一顆芯片內(nèi)封裝多個(gè)不同架構(gòu)的裸片,實(shí)現(xiàn)更高集成度。相比于復(fù)雜、昂貴的硅穿孔(TSV),EMIB 封裝了一個(gè)小小的硅橋接芯片,只在需要的地方對裸片進(jìn)行互連,而且可以使用標(biāo)準(zhǔn)的倒裝芯片(flip-chip)組裝,讓高速信號從芯片直通封裝基底。
Patrick 強(qiáng)調(diào) EMIB 技術(shù)給 Stratix 10 DRAM SiP 帶來的優(yōu)勢包括簡單、可擴(kuò)展,功耗極低,以及優(yōu)異的信號和電源完整性。
如果說此前英特爾開始代工 Altera 的 FPGA 產(chǎn)品只是雙方融合的開始,那么這款產(chǎn)品的推出則標(biāo)志著 Altera 和英特爾開始了在技術(shù)上的融合,讓 Altera+英特爾的產(chǎn)品模式走向深入;
3. 提到 FPGA 和 CPU 的數(shù)據(jù)傳輸速度,大家有沒有想到前不久 IBM 宣布和賽靈思合作,將 POWER 架構(gòu)推向服務(wù)器領(lǐng)域的新聞,而 POWER 架構(gòu)挺進(jìn)服務(wù)器領(lǐng)域最大的亮點(diǎn)莫過于可通過 OpenPOWER 架構(gòu)獨(dú)有的 CAPI 一致性加速處理器接口實(shí)現(xiàn)與 FPGA 間更快速的通信,從而更好地為處理器實(shí)現(xiàn)加速。相較于高通目前在服務(wù)器方面的嘗試,IBM 的 POWER 架構(gòu)可能還會對英特爾構(gòu)成一定威脅。
如果說以 GPGPU 為主,大幅度提高系統(tǒng)浮點(diǎn)運(yùn)算能力是第一代異構(gòu)加速計(jì)算的典型特征的話,我們現(xiàn)在可以基本總結(jié)出以 FPGA 為主,所謂的第二代異構(gòu)計(jì)算的一些重要特征:第一:具備緩存一致性和對等的內(nèi)存訪問能力,這是最為重要的特征,與第一代異構(gòu)計(jì)算有了本質(zhì)的不同,并對應(yīng)用編程具備了明顯的友好性;第二:基于 FPGA 可靈活配置加速模塊,毫無疑問,在第二代異構(gòu)計(jì)算中,F(xiàn)PGA 將是一大主角,它本身靈活的可編程性為應(yīng)用加速提供了豐富的應(yīng)用場景;第三、它將隆重開啟整數(shù)運(yùn)算加速的大門, 隨著 FPGA 編程的便利性進(jìn)一步提高,F(xiàn)PGA 的整數(shù)型加速將會迅速普及(當(dāng)然絕不是說 FPGA 不能用于浮點(diǎn)加速,只是看應(yīng)用比例),這對于當(dāng)前的大數(shù)據(jù)、海量視頻處理、圖像匹配等新興需求不謀而合,就像當(dāng)初 GPGPU 與科學(xué)計(jì)算的發(fā)展相得益彰一樣,第二代異構(gòu)計(jì)算將把相應(yīng)的整數(shù)型應(yīng)用的性能帶到新的高度。
因此我們不得不佩服英特爾的先見之明,搶先一步將 Altera 收入囊中,并在前不久的 IDF15 美國站上,針對 IBM 的 CAPI+FPGA 加速方案,正式發(fā)布了 CPU 通過 QPI 直聯(lián) FPGA 的方案設(shè)計(jì)。而此次 Altera 最新的 Stratix 10 DRAM SiP 產(chǎn)品的發(fā)布,無疑讓英特爾 CPU+Altera SoC FPGA 加速方案可以在服務(wù)器市場獨(dú)步天下再填重量級砝碼。
Stratix 10 后續(xù)可能集成的一些功能模塊
“Stratix 10 DRAM SiP 產(chǎn)品是一個(gè)系列,面向不同的應(yīng)用需求,我們將推出三種不同配置,搭載不同存儲容量的 DRAM,從 4GB 到 16GB 不等,當(dāng)然,這里 DRAM 的存儲容量只要夠用就好,因?yàn)樗膸捒梢赃_(dá)到每秒 1TB,如果還需要更多的存儲,完全可以接入到更大的系統(tǒng)級存儲?!盇ltera 公司高級產(chǎn)品營銷總監(jiān) Manish Deo 最后強(qiáng)調(diào)。
更多有關(guān) Stratix 10 的資訊,歡迎訪問 與非網(wǎng) Stratix 10 專區(qū)
與非網(wǎng)原創(chuàng)內(nèi)容,未經(jīng)許可,不得轉(zhuǎn)載!
?
?