Cadence、Dropbox、SAP、ServiceNow 率先使用 NVIDIA NeMo Retriever 優(yōu)化語義檢索,實現(xiàn)準(zhǔn)確的 AI 推理
NVIDIA 今日宣布推出一項生成式 AI 微服務(wù),支持企業(yè)將自定義大語言模型與企業(yè)數(shù)據(jù)相連接,使其 AI 應(yīng)用能夠提供高度準(zhǔn)確的響應(yīng)。
NVIDIA NeMo? Retriever 是 NVIDIA NeMo(一個用于構(gòu)建、自定義和部署生成式 AI 模型的框架和工具系列)的一項全新服務(wù),通過企業(yè)級檢索增強(qiáng)生成(RAG)功能,幫助組織加強(qiáng)其生成式 AI 應(yīng)用。
作為一項語義檢索微服務(wù),NeMo Retriever 借助經(jīng) NVIDIA 優(yōu)化的算法,幫助生成式 AI 應(yīng)用作出更加準(zhǔn)確的回答。使用該微服務(wù)的開發(fā)者,可以將其 AI 應(yīng)用與位于各個云和數(shù)據(jù)中心的業(yè)務(wù)數(shù)據(jù)相連通。該服務(wù)為 AI 代工添加了 NVIDIA 優(yōu)化的 RAG 功能,并被整合到亞馬遜云科技 Marketplace 上的 NVIDIA AI Enterprise 軟件平臺中。
Cadence、Dropbox、SAP 和 ServiceNow 等公司已率先與 NVIDIA 合作,將生產(chǎn)就緒型 RAG 功能整合至其自定義生成式 AI 應(yīng)用和服務(wù)中。
NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“具有 RAG 功能的生成式 AI 應(yīng)用是企業(yè)的下一個殺手級應(yīng)用。借助 NVIDIA NeMo Retriever,開發(fā)者可以創(chuàng)建自定義生成式 AI 聊天機(jī)器人、AI 助手和摘要工具。它們能夠訪問企業(yè)的業(yè)務(wù)數(shù)據(jù),通過準(zhǔn)確且有價值的生成式 AI 智能來提高生產(chǎn)力?!?/p>
全球頭部企業(yè)借助 NeMo Retriever 提高大語言模型(LLM)準(zhǔn)確性
電子系統(tǒng)設(shè)計領(lǐng)導(dǎo)廠商 Cadence 為超大規(guī)模計算、5G 通信、汽車、移動、航空航天、消費和醫(yī)療市場的企業(yè)提供服務(wù)。該公司正與 NVIDIA 合作,為工業(yè)電子設(shè)計領(lǐng)域的生成式 AI 應(yīng)用開發(fā) RAG 功能。
Cadence 總裁兼首席執(zhí)行官 Anirudh Devgan 表示:“生成式 AI 引入了創(chuàng)新方法來滿足客戶需求,比如能在設(shè)計流程早期發(fā)現(xiàn)潛在缺陷的工具等。我們的研究人員正在與 NVIDIA 合作,使用 NeMo Retriever 進(jìn)一步提高生成式 AI 應(yīng)用的準(zhǔn)確性和相關(guān)性,以便發(fā)現(xiàn)問題,并幫助客戶更快地將優(yōu)質(zhì)產(chǎn)品推向市場。”
破解精確的生成式 AI 應(yīng)用的“密碼”
與開源 RAG 工具套件不同,NeMo Retriever 是通過具有商業(yè)可行性的模型、API 穩(wěn)定性、安全補(bǔ)丁和企業(yè)級支持,來為生產(chǎn)就緒型生成式 AI 賦能。
經(jīng) NVIDIA 優(yōu)化的算法使 Retriever 的嵌入模型能夠產(chǎn)出準(zhǔn)確性最高的結(jié)果。經(jīng)過優(yōu)化的嵌入模型能夠捕捉單詞之間的關(guān)系,使 LLM 能夠處理和分析文本數(shù)據(jù)。
企業(yè)可以使用 NeMo Retriever 將 LLM 連接到多個數(shù)據(jù)源和知識庫,這樣用戶就可以輕松地與數(shù)據(jù)交互,并通過簡單的對話指令獲得準(zhǔn)確且最新的答案。通過使用由 Retriever 驅(qū)動的應(yīng)用,企業(yè)可以使用戶安全地訪問多種數(shù)據(jù)格式的信息,如文本、PDF、圖像和視頻等。
借助 NeMo Retriever,企業(yè)能夠以更少的訓(xùn)練獲得更準(zhǔn)確的結(jié)果,加快產(chǎn)品上市時間,并減少生成式 AI 應(yīng)用開發(fā)產(chǎn)生的能耗。
通過 NVIDIA AI Enterprise 實現(xiàn)可靠、簡單且安全的部署
企業(yè)可以在幾乎任何數(shù)據(jù)中心或云端的 NVIDIA 加速計算上部署由 NeMo Retriever 驅(qū)動的應(yīng)用,以便在推理過程中運行。NVIDIA AI Enterprise 可支持通過 NVIDIA Triton 推理服務(wù)器?、NVIDIA TensorRT?、NVIDIA TensorRT-LLM 及其他 NVIDIA AI 軟件進(jìn)行加速的高性能推理。