加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長(zhǎng)期合作伙伴
立即加入
  • 正文
  • 推薦器件
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

NVIDIA NIM 革命性地改變模型部署,將全球數(shù)百萬(wàn)開(kāi)發(fā)者轉(zhuǎn)變?yōu)樯墒?AI 開(kāi)發(fā)者

06/03 13:54
1372
閱讀需 10 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

NVIDIA 于今日宣布,全球 2,800 萬(wàn)開(kāi)發(fā)者現(xiàn)可下載 NVIDIA NIM?——一種推理微服務(wù),通過(guò)經(jīng)優(yōu)化的容器的形式提供模型——以部署在云、數(shù)據(jù)中心或工作站上。借助 NVIDIA NIM,開(kāi)發(fā)者能夠輕松地為 copilots、聊天機(jī)器人等構(gòu)建生成式 AI 應(yīng)用,所需時(shí)間從數(shù)周縮短至幾分鐘。

這些新的生成式 AI 應(yīng)用正變得越來(lái)越復(fù)雜,通常需要使用具有不同功能的多個(gè)模型來(lái)生成文本、圖像、視頻、語(yǔ)音等。NVIDIA NIM 提供了一種簡(jiǎn)單、標(biāo)準(zhǔn)化的方式,將生成式 AI 添加到應(yīng)用中,顯著提高了開(kāi)發(fā)者的工作效率。

NIM 還可使企業(yè)能夠最大限度利用其基礎(chǔ)設(shè)施投資。例如,相較于未使用 NIM 的情況下,在 NIM 中運(yùn)行 Meta Llama 3-8B 時(shí),后者在加速基礎(chǔ)設(shè)施上可產(chǎn)生高達(dá) 3 倍的生成式 AI token。這使企業(yè)能夠大幅提高效率,使用相同的計(jì)算基礎(chǔ)設(shè)施來(lái)生成更多的結(jié)果。

包括 Cadence、Cloudera、Cohesity、DataStax、NetApp、Scale AI 和新思科技等近 200 家技術(shù)合作伙伴正在將 NIM 集成到他們的平臺(tái)中,以加快特定領(lǐng)域應(yīng)用的生成式 AI 部署,例如 copilot、代碼助手和數(shù)字人虛擬形象。從 Meta Llama 3 開(kāi)始,在 Hugging Face 上現(xiàn)已開(kāi)始提供 NIM。

NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“每個(gè)企業(yè)都希望在其運(yùn)營(yíng)中融入生成式 AI,但并非每個(gè)企業(yè)都擁有專門(mén)的 AI 研究團(tuán)隊(duì)。NVIDIA NIM 可被集成到任意平臺(tái)中,任何地方的開(kāi)發(fā)者都可以訪問(wèn),并且可以在任意環(huán)境中運(yùn)行——它正在助力科技行業(yè)將生成式 AI 普及到每一個(gè)企業(yè)組織?!?/p>

通過(guò) NVIDIA AI Enterprise 軟件平臺(tái),企業(yè)可以使用 NIM 在生產(chǎn)系統(tǒng)中部署 AI 應(yīng)用。從下個(gè)月開(kāi)始,NVIDIA 開(kāi)發(fā)者計(jì)劃的會(huì)員可以免費(fèi)使用 NIM,在其選擇的基礎(chǔ)設(shè)施上進(jìn)行研究、開(kāi)發(fā)和測(cè)試。

40 余個(gè) NIM 微服務(wù)為跨模式的生成式 AI 賦能

NIM 容器是預(yù)構(gòu)建的,以加速模型部署,可用于 GPU 加速推理,其中包括 NVIDIA CUDA? 軟件、NVIDIA Triton 推理服務(wù)器?和 NVIDIA TensorRT?-LLM 軟件。

在 ai.nvidia.com 網(wǎng)站上,超過(guò) 40 個(gè) NVIDIA 及社區(qū)模型可作為 NIM 端點(diǎn)進(jìn)行體驗(yàn),其中包括 Databricks DBRX、谷歌開(kāi)放模型 Gemma、Meta Llama 3、微軟 Phi-3、Mistral Large、Mixtral 8x22B 和 Snowflake Arctic。

開(kāi)發(fā)者現(xiàn)在可以從 Hugging Face AI 平臺(tái)上,訪問(wèn) Meta Llama 3 模型的 NVIDIA NIM 微服務(wù)。通過(guò)基于 NVIDIA GPU 的 Hugging Face 推理端點(diǎn),只需點(diǎn)擊幾下,開(kāi)發(fā)者就能在其選擇的云平臺(tái)上輕松地訪問(wèn)和運(yùn)行 Llama 3 NIM。

企業(yè)可以使用 NIM 來(lái)運(yùn)行用于生成文本、圖像和視頻、語(yǔ)音以及數(shù)字人的應(yīng)用。借助面向數(shù)字生物學(xué)的 NVIDIA BioNeMo? NIM 微服務(wù),研究人員可以構(gòu)建新的蛋白質(zhì)結(jié)構(gòu),加速藥物研發(fā)。

數(shù)十家醫(yī)療公司正在一系列應(yīng)用中部署 NIM,以便在手術(shù)規(guī)劃、數(shù)字助手、藥物研發(fā)和臨床試驗(yàn)優(yōu)化等一系列應(yīng)用中為生成式 AI 推理提供動(dòng)力。

借助全新的 NVIDIA ACE NIM 微服務(wù),開(kāi)發(fā)者可以在客戶服務(wù)、遠(yuǎn)程醫(yī)療、教育、游戲和娛樂(lè)等應(yīng)用中,輕松構(gòu)建和操作栩栩如生的交互式數(shù)字人。

數(shù)百家 AI 生態(tài)系統(tǒng)合作伙伴已嵌入 NIM

包括 Canonical、Red Hat、Nutanix 和 VMware(已被博通收購(gòu))在內(nèi)的平臺(tái)提供商已在開(kāi)源 KServe 或企業(yè)解決方案方面支持 NIM。AI 應(yīng)用公司 Hippocratic AI、Glean、Kinetica 和 Redis 也在部署 NIM 來(lái)支持生成式 AI 推理。

領(lǐng)先的 AI 工具和 MLOps 合作伙伴(包括亞馬遜 SageMaker、微軟 Azure AI、Dataiku、DataRobot、deepset、Domino Data Lab、LangChain、Llama Index、Replicate、Run.ai、Saturn Cloud、Securiti AI 和 Weights & Biases)也已將 NIM 嵌入到其平臺(tái),使開(kāi)發(fā)者能夠通過(guò)優(yōu)化推理來(lái)構(gòu)建和部署特定領(lǐng)域的生成式 AI 應(yīng)用。

全球系統(tǒng)集成商和服務(wù)交付合作伙伴埃森哲、德勤、Infosys、Latentview、Quantiphi、SoftServe、塔塔咨詢服務(wù)(TCS)和威普羅(Wipro)已經(jīng)建立了 NIM 能力,以幫助全球企業(yè)快速開(kāi)發(fā)和部署生產(chǎn)型 AI 策略。

企業(yè)幾乎可以在任何地方運(yùn)行支持 NIM 的應(yīng)用,包括在全球基礎(chǔ)設(shè)施制造商思科、戴爾科技、慧與、聯(lián)想和超微,以及服務(wù)器制造商永擎電子、華碩、技嘉、鴻佰科技、英業(yè)達(dá)、和碩、QCT、緯創(chuàng)資通和緯穎科技的 NVIDIA 認(rèn)證系統(tǒng)? 上運(yùn)行。NIM 微服務(wù)也已集成至亞馬遜云科技、谷歌云、Azure 和 Oracle 云基礎(chǔ)設(shè)施中。

行業(yè)巨頭通過(guò) NIM 加強(qiáng)生成式 AI

行業(yè)領(lǐng)導(dǎo)者 Foxconn、和碩、Amdocs、勞氏公司、 ServiceNow 和西門(mén)子利用 NIM 來(lái)加強(qiáng)生成式 AI 應(yīng)用,涉及制造業(yè)、醫(yī)療、金融服務(wù)、零售、客戶服務(wù)等領(lǐng)域:

  • Foxconn——作為全球最大的電子制造商,F(xiàn)oxconn 正在使用 NIM 開(kāi)發(fā)針對(duì)特定領(lǐng)域的大語(yǔ)言模型(LLM),并將這些模型嵌入到其 AI 工廠的各種內(nèi)部系統(tǒng)和流程中,用于智能制造、智慧城市和智能電動(dòng)汽車。
  • 和碩——這家臺(tái)灣電子制造公司正在將 NIM 用于 Project TaME,這是一個(gè)當(dāng)?shù)氐幕旌蠈<遥∕oE)模型,旨在推動(dòng)各行各業(yè)開(kāi)發(fā)本地化的 LLM。 ● Amdocs——這家為通信和媒體公司提供軟件和服務(wù)的全球領(lǐng)先供應(yīng)商正在使用 NIM 運(yùn)行客戶計(jì)費(fèi) LLM,該模型顯著降低了 token 成本,將準(zhǔn)確性提高了 30%,并將延遲降低了 80%,從而實(shí)現(xiàn)近乎實(shí)時(shí)的響應(yīng)。
  • 勞氏公司——這家《財(cái)富》雜志 50 強(qiáng)家居裝飾公司正在將生成式 AI 用于各種用例,例如,該零售商正在利用 NVIDIA NIM 推理微服務(wù)來(lái)提升員工和客戶的體驗(yàn)。
  • ServiceNow——這個(gè)用于業(yè)務(wù)轉(zhuǎn)型的 AI 平臺(tái)于今年早些時(shí)候宣布成為首批接入 NIM 的平臺(tái)提供商之一,幫助客戶實(shí)現(xiàn)快速、可擴(kuò)展且更具成本效益的 LLM 開(kāi)發(fā)和部署。NIM 微服務(wù)已經(jīng)集成到 Now AI 多模態(tài)模型中,可供添加了 ServiceNow 的生成式 AI 功能 Now Assist 的客戶使用。
  • 西門(mén)子——作為專注于工業(yè)、基礎(chǔ)設(shè)施、交通和醫(yī)療領(lǐng)域的全球科技公司,西門(mén)子正在將其運(yùn)營(yíng)技術(shù)與 NIM 微服務(wù)整合,用于車間 AI 工作負(fù)載。此外,西門(mén)子還利用 NIM 為其 Machine Operators 構(gòu)建了一個(gè)本地部署版本的 Industrial Copilot。

可用性 開(kāi)發(fā)者可在 ai.nvidia.com 網(wǎng)站上免費(fèi)試用 NVIDIA 微服務(wù)。企業(yè)可通過(guò)在 NVIDIA 認(rèn)證系統(tǒng)和領(lǐng)先的云平臺(tái)上運(yùn)行的 NVIDIA AI Enterprise 來(lái)部署生產(chǎn)級(jí) NIM 微服務(wù)。從下個(gè)月開(kāi)始,NVIDIA 開(kāi)發(fā)者計(jì)劃的會(huì)員將能夠免費(fèi)使用 NIM 來(lái)進(jìn)行研究和測(cè)試。

推薦器件

更多器件
器件型號(hào) 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊(cè) ECAD模型 風(fēng)險(xiǎn)等級(jí) 參考價(jià)格 更多信息
STM32H743XIH6TR 1 STMicroelectronics High-performance and DSP with DP-FPU, Arm Cortex-M7 MCU with 2MBytes of Flash memory, 1MB RAM, 480 MHz CPU, Art Accelerator, L1 cache, external memory interface, large set of peripherals

ECAD模型

下載ECAD模型
暫無(wú)數(shù)據(jù) 查看
STM32F401VET6 1 STMicroelectronics High-performance access line, Arm Cortex-M4 core with DSP and FPU, 512 Kbytes of Flash memory, 84 MHz CPU, ART Accelerator

ECAD模型

下載ECAD模型
$10.53 查看
USB2514B-AEZC-TR 1 Microchip Technology Inc UNIVERSAL SERIAL BUS CONTROLLER

ECAD模型

下載ECAD模型
$3.31 查看

相關(guān)推薦

電子產(chǎn)業(yè)圖譜