NVIDIA 于今日發(fā)布兩項(xiàng)全新大型語(yǔ)言模型(LLM)云 AI 服務(wù)——NVIDIA NeMo 大型語(yǔ)言模型服務(wù)和 NVIDIA BioNeMo LLM 服務(wù),使開(kāi)發(fā)者能夠輕松調(diào)整 LLM 并部署定制的 AI 應(yīng)用程序,其可用于內(nèi)容生成、文本摘要、聊天機(jī)器人、代碼開(kāi)發(fā),以及蛋白質(zhì)結(jié)構(gòu)和生物分子特性預(yù)測(cè)等。
通過(guò) NeMo LLM 服務(wù),開(kāi)發(fā)者能夠在 NVIDIA 管理的基礎(chǔ)設(shè)施上使用被稱為提示學(xué)習(xí)的訓(xùn)練方法快速定制多個(gè)預(yù)訓(xùn)練基礎(chǔ)模型。NVIDIA BioNeMo 服務(wù)是云應(yīng)用程序編程接口(API),它可以將 LLM 用例擴(kuò)展到語(yǔ)言以外的科學(xué)應(yīng)用中,加快制藥和生物技術(shù)公司的藥物研發(fā)速度。
NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示: “大型語(yǔ)言模型具有改變每個(gè)行業(yè)的潛力。通過(guò)對(duì)基礎(chǔ)模型進(jìn)行調(diào)整,可將 LLM 的力量帶給數(shù)百萬(wàn)的開(kāi)發(fā)者,讓他們無(wú)需重新構(gòu)建龐大的模型,即可創(chuàng)建各種語(yǔ)言服務(wù)并推動(dòng)科學(xué)發(fā)現(xiàn)?!?/p>
NeMo LLM 服務(wù)通過(guò)提示學(xué)習(xí)提高準(zhǔn)確性,加快部署速度
借助 NeMo LLM 服務(wù),開(kāi)發(fā)者可以使用自己的訓(xùn)練數(shù)據(jù)定制基礎(chǔ)模型——從 30 億個(gè)參數(shù)到世界上最大的 LLM 之一 Megatron 530B。與從頭開(kāi)始訓(xùn)練模型所需的數(shù)周或數(shù)月相比,該過(guò)程只需幾分鐘到幾小時(shí)。
提示學(xué)習(xí)是使用一種名為 P-tuning 的技術(shù)來(lái)定制模型,使開(kāi)發(fā)者只需使用幾百個(gè)示例就能快速定制最初需要使用數(shù)十億個(gè)數(shù)據(jù)點(diǎn)訓(xùn)練的基礎(chǔ)模型。定制流程生成任務(wù)專屬的提示標(biāo)記,這些標(biāo)記會(huì)與基礎(chǔ)模型相結(jié)合,為特定用例提供更高的準(zhǔn)確性和更相關(guān)的響應(yīng)。
開(kāi)發(fā)者可以使用同一模型定制多個(gè)用例并生成許多不同的 Prompt Token。游樂(lè)場(chǎng)功能提供可以輕松實(shí)驗(yàn)并與模型互動(dòng)的無(wú)代碼選項(xiàng),進(jìn)一步提高了 LLM 對(duì)行業(yè)特定用例的有效性和可及性。
一旦準(zhǔn)備好部署,經(jīng)過(guò)調(diào)整的模型即可在云實(shí)例、本地系統(tǒng)上或通過(guò) API 運(yùn)行。
BioNeMo LLM 服務(wù)使研究人員能夠充分利用大規(guī)模模型的力量
BioNeMo LLM 服務(wù)包括兩個(gè)用于化學(xué)和生物學(xué)應(yīng)用的新 BioNeMo 語(yǔ)言模型。該服務(wù)提供蛋白質(zhì)、DNA 和生物化學(xué)數(shù)據(jù)方面的支持,幫助研究人員發(fā)現(xiàn)生物序列中的模式和洞察。
BioNeMo 使研究人員能夠利用包含數(shù)十億個(gè)參數(shù)的模型來(lái)擴(kuò)大研究范圍。這些大型模型可以儲(chǔ)存更多關(guān)于蛋白質(zhì)結(jié)構(gòu)、基因間進(jìn)化關(guān)系的信息,甚至可以生成用于治療的新型生物分子。
? ? ?
云 API 提供對(duì) Megatron 530B 和其他現(xiàn)成模型的訪問(wèn)
除了調(diào)整基礎(chǔ)模型之外,LLM 服務(wù)還提供通過(guò)云 API 使用現(xiàn)成和定制模型的選項(xiàng)。
? ? ?
這讓開(kāi)發(fā)者可以訪問(wèn)包括 Megatron 530B 在內(nèi)的各種預(yù)訓(xùn)練 LLM,以及使用 NVIDIA NeMo Megatron 框架創(chuàng)建的 T5 和 GPT-3 模型。NVIDIA NeMo Megatron 框架現(xiàn)已進(jìn)入公測(cè)階段,可支持各種應(yīng)用和多語(yǔ)言服務(wù)需求。 ? ??
汽車、計(jì)算、教育、醫(yī)療、電信等行業(yè)的領(lǐng)導(dǎo)者正在使用 NeMo Megatron 為客戶提供中文、英語(yǔ)、韓語(yǔ)、瑞典語(yǔ)等語(yǔ)言的領(lǐng)先服務(wù)。
供貨情況
NeMo LLM 和 BioNeMo 服務(wù)以及云 API 預(yù)計(jì)將在下個(gè)月開(kāi)放搶先體驗(yàn),開(kāi)發(fā)者現(xiàn)在就可以申請(qǐng)并了解詳情。
現(xiàn)在可以從 NVIDIA NGC? 獲得 NeMo Megatron 框架的公測(cè)版,并且該框架在優(yōu)化后,可在 NVIDIA DGX? Foundry 和 NVIDIA DGX SuperPOD? 以及 Amazon Web Services、Microsoft Azure 和 Oracle Cloud Infrastructure 的加速云實(shí)例上運(yùn)行。
想要體驗(yàn) NeMo Megatron 框架的開(kāi)發(fā)者可以免費(fèi)試用 NVIDIA LaunchPad 實(shí)驗(yàn)室。
關(guān)注黃仁勛在 GTC 2022 上的主題演講,進(jìn)一步了解 NVIDIA AI 驅(qū)動(dòng)的大型語(yǔ)言模型。