作為專為NVIDIA? BlueField? 網(wǎng)絡平臺而設計的數(shù)據(jù)中心基礎設施軟件框架,NVIDIA? DOCA? 使廣大開發(fā)者能夠利用其行業(yè)標準API 在 NVIDIA BlueField 網(wǎng)絡平臺上快速創(chuàng)建應用程序和服務,并啟用 NVIDIA BlueField DPU 和NVIDIA BlueField SuperNIC 的強大功能,提供突破性的網(wǎng)絡、安全和存儲性能。
近日發(fā)布的 NVIDIA DOCA 2.6 引入了 NVIDIA BlueField 網(wǎng)絡平臺的新增功能和增強功能,可實現(xiàn)高性能和安全的 AI 云,從而大規(guī)模加速數(shù)據(jù)中心工作負載和 AI 應用。借助可編程擁塞控制(PCC)和數(shù)據(jù)路徑加速(DPA),更新的 DOCA SDK 也為開發(fā)者提供了廣泛的開發(fā)框架,并提供新增功能和增強功能。
專為 AI 云而設計的網(wǎng)絡平臺
NVIDIA? Spectrum-X? 是適用于 AI 云“東西向”流量的以太網(wǎng)參考架構,其中主要包括 NVIDIA BlueField-3 SuperNIC 和 Spectrum-4 交換機。Spectrum-X 通過創(chuàng)新的高性能網(wǎng)絡為 AI 云提供峰值性能,從而有效滿足 AI 工作負載對 AI 云基礎設施的性能需求。
最新的DOCA 2.6 版本支持 Spectrum-X 參考架構 1.0,優(yōu)化了 Spectrum-4 交換機和 BlueField-3SuperNIC 的性能協(xié)同,不但為 AI 工作負載提供優(yōu)化的無損 RoCEv2 和動態(tài)路由功能,而且支持零接觸 RoCE擁塞控制(ZTR-CC)和可編程的 DOCA-PCC,從而顯著提高 AI 云的性能,并為租戶提供確定和隔離的性能。
開發(fā)硬件加速的網(wǎng)絡應用程序
DOCA Flow 是用于卸載和加速網(wǎng)絡轉向(Network Steering)的開發(fā)庫,可以在軟件定義網(wǎng)絡(SDN)的服務中提供可編程的快速流水線(Pipeline),并通過采用 DOCA-CT 管道(Pipe)來加速連接跟蹤和管理會話狀態(tài)。
在 DOCA 2.6 版本中,DOCA-CT 通過簡化流水線來提升效率,并支持 NAT64 來實現(xiàn) IPv6 和 IPv4 之間的地址轉換,從而使連接跟蹤與 NAT 流水線相結合來獲得更好的性能。同時,DOCA Flow 可以通過修改可選字段來擴展 Geneve 隧道,且通過啟用 Geneve 來替代如 MPLS 等其他隧道方案。DOCA Flow 還支持將硬件哈希計算公開給軟件,對于復雜的流水線可以對齊軟硬件的哈希結果。
DOCA 服務新增功能
基于 BlueField 的分布式路由和 EVPN 服務
DOCA 基于主機的網(wǎng)絡(HBN)服務 2.1 版本支持 EVPN 增強功能,可為大規(guī)模裸金屬云構建無控制器的虛擬私有云(VPC)網(wǎng)絡。同時,它支持 L3 EVPN 來實現(xiàn)對稱的 VXLAN 路由,從而實現(xiàn) L3 的多租戶安全;支持本地 VRF 路由泄露(測試版),從而隔離租戶以安全訪問互聯(lián)網(wǎng)和共享服務;支持多跳 eBGP 對等互連,從而適用于大規(guī)模 VXLAN EVPN 的部署;支持用于有狀態(tài)訪問控制列表(ACL)的 L3 接口綁定,從而實現(xiàn)對 L3 流量的過濾;支持其它面向 DPU 的接口,以便與其他服務進行集成。
計時即服務解決方案
DOCA Firefly 服務利用 BlueField SuperNIC 和 DPU 來加速時間同步。在 DOCA 2.6 版本中,它增加了時鐘跳轉時的時間檢查功能,從而可以對伺服計時算法進行修復。DOCAFirefly 服務可以廣泛的應用于電信、傳媒娛樂、金融服務等行業(yè),比如電信行業(yè)在 5G移動通信部署的基于網(wǎng)絡的時間同步,傳媒娛樂行業(yè)基于虛幻引擎(Unreal Engine)的虛擬制作,以及金融服務行業(yè)滿足 MiFID II合規(guī)性的高頻交易(HFT)。
更多其他更新
BlueField 平臺增強功能
平臺安全 – UEFI 密碼策略
平臺管理 – BMC 健壯性
BlueField 安裝包簡化升級 – 增加 BMC 和 eROT 固件
結束語
不同規(guī)模的 AI 工作負載和不同類型的 AI 應用程序需要不同的、復雜的網(wǎng)絡。作為 AI 和加速計算領域的領導者,NVIDIA 提供針對 AI 進行優(yōu)化的端到端網(wǎng)絡平臺及解決方案,實現(xiàn)以峰值效率有效運行的 AI 網(wǎng)絡,從而提高 AI 云的性能。從加速計算全棧架構的角度,NVIDIA 將 AI 網(wǎng)絡與 GPU 加速計算系統(tǒng)相結合,從硬件和軟件進行技術互補和協(xié)同,提升全棧架構各層之間的運營效率,從而應對企業(yè)將 AI 嵌入現(xiàn)有應用和服務時所面臨的基礎設施運營和部署挑戰(zhàn)。