NVIDIA 今日發(fā)布 NVIDIA AI 平臺(tái)的多項(xiàng)重要更新。該平臺(tái)是一套致力于推進(jìn)語(yǔ)音、推薦系統(tǒng)、超大規(guī)模推理等工作負(fù)載的軟件套件,目前已被 Amazon, Microsoft, Snap 和日本電信電話株式會(huì)社等全球行業(yè)領(lǐng)導(dǎo)者所采用。
NVIDIA 也宣布了 NVIDIA? AI 加速計(jì)劃,以助力確保 NVIDIA 軟件和解決方案合作伙伴所開(kāi)發(fā) AI 應(yīng)用的性能和可靠性。該計(jì)劃針對(duì)各種經(jīng)過(guò)驗(yàn)證的 AI 加速應(yīng)用增加了可見(jiàn)性,使企業(yè)客戶能夠放心地在 NVIDIA AI 平臺(tái)上進(jìn)行部署。Adobe、紅帽(Red Hat)和 VMware 等 100 多家合作伙伴參與了計(jì)劃啟動(dòng)儀式。
NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示: “NVIDIA AI 可定義為全球 AI 社區(qū)的軟件工具箱,從 AI 研究者和數(shù)據(jù)科學(xué)家們,到數(shù)據(jù)和機(jī)器學(xué)習(xí)的運(yùn)營(yíng)團(tuán)隊(duì)。NVIDIA 在 GTC 2022上有著大量的新發(fā)布。無(wú)論是創(chuàng)建互動(dòng)能力更強(qiáng)的聊天機(jī)器人和虛擬助手,還是構(gòu)建更加智能的推薦系統(tǒng)來(lái)幫助消費(fèi)者做出更完善的購(gòu)買決策,亦或是以最大的規(guī)模編排 AI 服務(wù),NVIDIA AI 始終能夠針對(duì)您的需求提供強(qiáng)大的助力?!?/p>
NVIDIA AI 可供開(kāi)發(fā)者免費(fèi)使用,包括用于語(yǔ)音 AI 的 NVIDIA Riva 和用于智能推薦系統(tǒng)的 NVIDIA Merlin?,這兩款軟件均已正式全面上線。而整個(gè)軟件套件也進(jìn)行了更新,包括 NVIDIA Triton、NeMo、Maxine 和 TAO 工具包等工具。?
此外,NVIDIA AI Enterprise 2.0 現(xiàn)已經(jīng)過(guò)優(yōu)化和認(rèn)證,并支持所有主要的數(shù)據(jù)中心和云平臺(tái),包括裸金屬服務(wù)器、虛擬化基礎(chǔ)設(shè)施和純 CPU 系統(tǒng)。該套件現(xiàn)在支持 Red Hat OpenShift 和 VMware vSphere with Tanzu。
用于構(gòu)建領(lǐng)先AI應(yīng)用的軟件工具
NVIDIA AI 是由多項(xiàng)具有關(guān)鍵功能的 SDK 和工具所組成,可用于跨多個(gè)節(jié)點(diǎn)上對(duì) AI 工作負(fù)載進(jìn)行快速部署、管理和擴(kuò)展,為復(fù)雜的訓(xùn)練和機(jī)器學(xué)習(xí)工作負(fù)載提供有力的支持。它包含以下軟件和工具:
- NVIDIA Triton? :NVIDIA Triton 是一款多功能開(kāi)源超大規(guī)模模型推理解決方案。其最新版本包含三項(xiàng)關(guān)鍵更新:用于加速部署優(yōu)化模型的模型導(dǎo)航器、用于在 Kubernetes 中進(jìn)行高效擴(kuò)展的管理服務(wù),以及能夠?qū)跇?shù)的模型進(jìn)行推理的森林推理庫(kù),其具有可解釋性,可在每個(gè)應(yīng)用中實(shí)現(xiàn)快速、經(jīng)過(guò)優(yōu)化和可擴(kuò)展的AI。
- NVIDIA Riva 2.0:這款領(lǐng)先的語(yǔ)音 AI SDK 包含具有領(lǐng)先識(shí)別率的預(yù)訓(xùn)練模型,使開(kāi)發(fā)者能夠?yàn)槠湫袠I(yè)定制實(shí)時(shí)語(yǔ)音AI應(yīng)用程序,其準(zhǔn)確率比普通服務(wù)高 2 倍。Riva 2.0 包含 7 種語(yǔ)言的語(yǔ)音識(shí)別、基于深度學(xué)習(xí)仿真人發(fā)音的語(yǔ)音合成(包括男聲和女聲)以及可通過(guò) NVIDIA TAO 工具包進(jìn)行的自定義調(diào)優(yōu)。NVIDIA 還發(fā)布了涵蓋企業(yè)級(jí)支持的付費(fèi)產(chǎn)品 NVIDIA Riva Enterprise。
- NVIDIA NeMo Megatron 0.9:NeMo Megatron 是一個(gè)用于訓(xùn)練大型語(yǔ)言模型(LLM)的框架。研究者和企業(yè)能夠用它來(lái)訓(xùn)練模型,使模型能夠收斂和擴(kuò)展至數(shù)萬(wàn)億個(gè)參數(shù),以便用于對(duì)話式 AI、推薦系統(tǒng)和基因組學(xué)等應(yīng)用。其最新版本中新增的優(yōu)化和方法能夠縮短端到端開(kāi)發(fā)和訓(xùn)練時(shí)間,并添加對(duì)云端訓(xùn)練的支持。NVIDIA 加速計(jì)算 LLM 的早期用戶包括京東、AI Sweden、Naver 和佛羅里達(dá)大學(xué)。
- NVIDIA Merlin 1.0:這是一個(gè)加速端到端推薦 AI 框架,用于大規(guī)模構(gòu)建高性能推薦系統(tǒng)。它包含兩個(gè)新庫(kù):Merlin Models 和 Merlin Systems。這些庫(kù)使數(shù)據(jù)科學(xué)家和機(jī)器學(xué)習(xí)工程師能夠確定哪些功能和模型最適合他們的應(yīng)用場(chǎng)景,并將推薦系統(tǒng)流水線部署為微服務(wù)。 ? ? ? ?
- NVIDIA Maxine:這個(gè)音頻和視頻質(zhì)量增強(qiáng) SDK 使用 AI 重塑實(shí)時(shí)通信,并引入回聲消除和音頻超分辨率。這兩項(xiàng)新功能能夠提高音頻質(zhì)量,帶來(lái)更清晰的通信體驗(yàn)。
NVIDIA AI 深受客戶的歡迎
各個(gè)行業(yè)的領(lǐng)導(dǎo)者正在使用 NVIDIA AI 來(lái)提高成本效益、打造更具吸引力的客戶體驗(yàn)并優(yōu)化 AI 應(yīng)用的功能。
Snap 對(duì)話式 AI 負(fù)責(zé)人 Alan Bekker 表示:“在 Snapchat 上,我們的社區(qū)每天使用 Lenses 超過(guò) 60 億次。Snap 正在使用 NVIDIA Riva 來(lái)優(yōu)化基于 AI 的語(yǔ)音功能,并將這些功能提供給 Lens Studio 創(chuàng)作者,助力其打造新一代高質(zhì)量 AR 體驗(yàn)?!?/p>
微軟技術(shù)研究員兼 Azure AI 首席技術(shù)官黃學(xué)東表示:“Microsoft Azure 認(rèn)知服務(wù) Translator 中的文件翻譯功能,能夠在翻譯文件時(shí)保留源文件的格式和結(jié)構(gòu),提高企業(yè)與客戶的互動(dòng)效率。通過(guò) NVIDIA Triton,我們能夠部署最新的 Z-Code 模型,在保證低延遲的前提下大幅提高文檔翻譯質(zhì)量,為用戶提供一流的翻譯服務(wù)?!?/p>
NVIDIA AI Enterprise 支持跨數(shù)據(jù)中心和云的容器化 AI
作為一款端到端、云原生的 AI 和數(shù)據(jù)分析工具與框架套件,NVIDIA AI Enterprise 2.0 軟件套件能夠加速各個(gè)行業(yè)的 AI 開(kāi)發(fā)和部署。Red Hat OpenShift 是領(lǐng)先的企業(yè)級(jí) Kubernetes 平臺(tái),獲得 Red Hat OpenShift 認(rèn)證的客戶能夠通過(guò) VMware vSphere 使用容器化機(jī)器學(xué)習(xí)工具,更輕松地在裸金屬或虛擬化系統(tǒng)上構(gòu)建、擴(kuò)展和共享模型。
紅帽合作伙伴生態(tài)系統(tǒng)部門高級(jí)副總裁 Stefanie Chiras 表示:“NVIDIA AI Enterprise 已獲得 Red Hat OpenShift 認(rèn)證,并且 OpenShift 已在 NVIDIA LaunchPad 上線,因此用戶可以同時(shí)獲得頂尖的 AI 開(kāi)發(fā)工具以及具有一致性的混合云基礎(chǔ)?,F(xiàn)在,IT 團(tuán)隊(duì)和數(shù)據(jù)科學(xué)家可以在 Red Hat OpenShift 上構(gòu)建并管理 NVIDIA AI,幫助企業(yè)加快實(shí)際生產(chǎn)中的智能應(yīng)用交付速度?!?/p>
NVIDIA AI Enterprise 2.0 還引入了更多支持訓(xùn)練和推理的 NVIDIA AI 軟件容器。對(duì) NVIDIA TAO 工具包的支持使企業(yè)開(kāi)發(fā)者能夠?qū)?NVIDIA 預(yù)訓(xùn)練 AI 模型進(jìn)行微調(diào)和優(yōu)化,從而簡(jiǎn)化自定義生產(chǎn)就緒模型的創(chuàng)建,而無(wú)需具備 AI 專業(yè)知識(shí)或大量訓(xùn)練數(shù)據(jù)。該軟件套件還包含最新發(fā)布的 NVIDIA Triton 推理服務(wù)器。
日本電信電話株式會(huì)社是日本電信電話集團(tuán)旗下的全球領(lǐng)先信息和通信技術(shù)解決方案提供商。該公司已采用 NVIDIA AI Enterprise 來(lái)助力研發(fā)團(tuán)隊(duì)加速構(gòu)建自然語(yǔ)言處理(NLP)和智能視頻分析應(yīng)用。
日本電信電話株式會(huì)社創(chuàng)新中心技術(shù)部總監(jiān) Shoichiro Henmi 表示:“我們的許多應(yīng)用開(kāi)發(fā)者現(xiàn)在都在使用加速計(jì)算,并有賴于內(nèi)部基礎(chǔ)設(shè)施來(lái)提供易于使用且具有高成本效益的 GPU 環(huán)境。我們認(rèn)為 NVIDIA AI Enterprise 是作為支持 AI 平臺(tái)的理想解決方案,它將為我們?cè)?VMware vSphere、Kubernetes 和云基礎(chǔ)設(shè)施中的大規(guī)模開(kāi)發(fā)工作提供支持。
”
客戶可以授權(quán) NVIDIA AI Enterprise 在 NVIDIA 認(rèn)證系統(tǒng)(NVIDIA-Certified Systems?)上運(yùn)行,也可以在沒(méi)有 NVIDIA GPU 的相同型號(hào)服務(wù)器上運(yùn)行,包括來(lái)自思科、戴爾科技、新華三、慧與(HPE)、浪潮、聯(lián)想、寧暢和超微等領(lǐng)先制造商的服務(wù)器。
企業(yè)還可以選擇在托管于全球各地 Equinix International Business Exchange?(IBX? )數(shù)據(jù)中心的服務(wù)器上進(jìn)行部署?,F(xiàn)已支持來(lái)自 AWS、谷歌云和 Microsoft Azure 的云實(shí)例。NVIDIA AI Enterprise 現(xiàn)已包含于 NVIDIA DGX 系統(tǒng)中。
供貨情況
作為 NVIDIA 開(kāi)發(fā)者計(jì)劃的一部分,開(kāi)發(fā)者均可使用 NVIDIA 的 AI 軟件集。
??
企業(yè) IT 團(tuán)隊(duì)和 AI 開(kāi)發(fā)者可以在 NVIDIA LaunchPad 實(shí)驗(yàn)室中體驗(yàn) NVIDIA AI 軟件,其是由 Equinix Metal 在全球九座 Equinix IBX 數(shù)據(jù)中心提供的免費(fèi)托管計(jì)劃。新增加的 LaunchPad 實(shí)驗(yàn)室包括 Riva 語(yǔ)音 AI 實(shí)驗(yàn)室,以及多個(gè)可以體驗(yàn) Red Hat OpenShift、VMware vSphere with Tanzu、TAO 工具包和 Triton 推理服務(wù)器(帶有 FIL 后端)的 NVIDIA AI Enterprise 實(shí)驗(yàn)室。 ?
觀看 NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛的 GTC 2022 主題演講,進(jìn)一步了解NVIDIA Hopper 和 H100。免費(fèi)注冊(cè) GTC 2022,與NVIDIA和行業(yè)領(lǐng)導(dǎo)者共襄盛會(huì)。
?