加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長(zhǎng)期合作伙伴
立即加入
  • 正文
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

國(guó)產(chǎn)大模型評(píng)測(cè)超GPT-4!李開(kāi)復(fù):十年內(nèi)不會(huì)套現(xiàn)

05/14 10:02
3050
閱讀需 13 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

作者 |??程茜,編輯?|??心緣

迎戰(zhàn)GPT-5!零一萬(wàn)物已啟動(dòng)下一代MoE模型訓(xùn)練。

智東西5月13日?qǐng)?bào)道,今天,在成立一周年之際,國(guó)內(nèi)AI大模型獨(dú)角獸零一萬(wàn)物重磅發(fā)布系列產(chǎn)品升級(jí)。

閉源模型方面,零一萬(wàn)物發(fā)布全球SOTA千億參數(shù)閉源大模型Yi-Large,評(píng)測(cè)結(jié)果部分超越GPT-4,同時(shí),零一萬(wàn)物創(chuàng)始人及CEO李開(kāi)復(fù)該公司正在訓(xùn)練更大參數(shù)規(guī)模的MoE模型Yi-XLarge MoE。在開(kāi)源領(lǐng)域,零一萬(wàn)物將早先發(fā)布的Yi-34B、Yi-9B、6B中小尺寸開(kāi)源模型版本升級(jí)為Yi-1.5系列,每個(gè)版本達(dá)到同尺寸中SOTA性能最佳。

開(kāi)源地址:https://huggingface.co/01-ai,魔搭社區(qū):https://www.modelscope.cn/organization/01ai

同時(shí),李開(kāi)復(fù)還介紹了一站式AI工作平臺(tái)萬(wàn)知,支持PC網(wǎng)頁(yè)和微信小程序使用,能做會(huì)議紀(jì)要、周報(bào)、寫(xiě)作助手、PPT,解讀財(cái)報(bào)、論文等各類文件,同時(shí)可以在1-2分鐘內(nèi)生成PPT。零一萬(wàn)物成立于去年5月,一周年之際其產(chǎn)品矩陣重磅升級(jí),2023年11月發(fā)布首款預(yù)訓(xùn)練大模型Yi-34B之后,其已經(jīng)形成了面向開(kāi)源、閉源和B端、C端的完整產(chǎn)品矩陣。

在媒體交流環(huán)節(jié),李開(kāi)復(fù)分享說(shuō),零一萬(wàn)物的C端海外生產(chǎn)力應(yīng)用今年收入預(yù)計(jì)將達(dá)到1~2億元,以國(guó)外用戶訂閱付費(fèi)為主。通用人工智能(AGI)是李開(kāi)復(fù)40多年來(lái)的夢(mèng)想,據(jù)他透露,他曾在一年前向投資人承諾10年不套現(xiàn),上市是零一萬(wàn)物團(tuán)隊(duì)未來(lái)兩年會(huì)努力的目標(biāo)。

李開(kāi)復(fù)看好國(guó)產(chǎn)芯片的發(fā)展,稱零一萬(wàn)物將在合適的時(shí)候去采用國(guó)產(chǎn)芯片,同時(shí)創(chuàng)新工場(chǎng)一直在關(guān)注這方面的投資。零一萬(wàn)物的模式比較務(wù)實(shí),會(huì)持續(xù)探索如何用最少的芯片、最低的成本訓(xùn)練出最好的模型。此外,李開(kāi)復(fù)也提到自己最近開(kāi)了抖音號(hào),將直播分享技術(shù)、產(chǎn)品以及一些觀點(diǎn)。

01.千億參數(shù)閉源大模型評(píng)測(cè)超GPT-4,已啟動(dòng)Yi-XLarge MoE,將沖擊GPT-5性能

零一萬(wàn)物發(fā)布全球SOTA千億參數(shù)閉源大模型Yi-Large,并同步開(kāi)放API,允許開(kāi)發(fā)者調(diào)用,在此基礎(chǔ)上還發(fā)布了一站式AI工作平臺(tái)萬(wàn)知。

李開(kāi)復(fù)透露,經(jīng)測(cè)試,Yi-Large評(píng)測(cè)結(jié)果已經(jīng)至少達(dá)到對(duì)齊GPT-4,部分指標(biāo)超越GPT-4。

在第三方測(cè)評(píng)結(jié)果中,Yi-Large在斯坦福英語(yǔ)測(cè)評(píng)中位居第二,僅次于GPT-4-Turbo,中文SuperCLUE結(jié)果中,位于國(guó)產(chǎn)大模型榜首。

此外,零一萬(wàn)物正在訓(xùn)練的基于MoE架構(gòu)的更大模型Yi-XLarge MoE,目前初步訓(xùn)練結(jié)果顯示,Yi-XLarge MoE的各個(gè)指標(biāo)都已經(jīng)超過(guò)Yi-Large,將沖擊GPT-5的性能與創(chuàng)新性。

在此前開(kāi)源的6B、34B模型之上,今天,該公司宣布Yi-1.5開(kāi)源系列同步升級(jí),開(kāi)源了6B、9B、34B不同參數(shù)規(guī)模,以及預(yù)訓(xùn)練、Chat模型等,包括Yi-34B Base+Chat、Yi-9B Base+Chat、Yi-6B Base+Chat。

李開(kāi)復(fù)稱,Yi-1.5系列模型已經(jīng)全面超越Gemma、Mistral以及Llama-3-8B模型,測(cè)評(píng)結(jié)果顯示,Yi-1.5系列中34B模型在34B-50B模型中處于絕對(duì)領(lǐng)先地位,并且一些指標(biāo)中表現(xiàn)甚至不遜色于70B模型。

那么,開(kāi)源、閉源模型如何見(jiàn)用戶?第一種方法是調(diào)用API,零一萬(wàn)物宣布面向國(guó)內(nèi)市場(chǎng)一次性發(fā)布了包含Yi-Large、Yi-Large-Turbo、Yi-Medium、Yi-Medium-200K、Yi-Vision、Yi-Spark等多款模型API接口。

此外,還有價(jià)錢(qián)相對(duì)較低的API,包括基于開(kāi)源34B模型微調(diào)出的Yi-Vision、多模態(tài)視覺(jué)模型Yi-Vision以及參數(shù)規(guī)模更小的Yi-Spark

目前零一萬(wàn)物已經(jīng)提供了免費(fèi)的額度,供開(kāi)發(fā)者使用,李開(kāi)復(fù)透露說(shuō),初步接觸的開(kāi)發(fā)者中有80%選擇從原來(lái)的模型轉(zhuǎn)移到使用零一萬(wàn)物的模型。

據(jù)零一萬(wàn)物API平臺(tái)負(fù)責(zé)人藍(lán)雨川透露,Yi-Large API的定價(jià)是20元對(duì)應(yīng)百萬(wàn)tokens,大概是GPT-4 Turbo成本和定價(jià)的1/3,對(duì)比其他大尺寸模型同樣非常有競(jìng)爭(zhēng)力。同時(shí)零一萬(wàn)物還提供了更快更便宜的Yi-Large-Turbo。

02.一站式AI工作站萬(wàn)知上線,速讀超長(zhǎng)文檔,2分鐘生成PPT

零一萬(wàn)物一站式AI工作站萬(wàn)知有微信小程序和PC網(wǎng)頁(yè)版。用戶通過(guò)使用萬(wàn)知既可以閱讀海量數(shù)據(jù)、分析圖表和文字,又可以在1-2分鐘內(nèi)生成PPT。

李開(kāi)復(fù)談道,所有應(yīng)用都應(yīng)該是AI原生,未來(lái)生產(chǎn)力工具的使用模式會(huì)徹底被顛覆,用戶提出指令,大模型就可以生成各種內(nèi)容。

他現(xiàn)場(chǎng)展示了萬(wàn)知的各項(xiàng)能力。

首先,當(dāng)問(wèn)到“我要做臺(tái)灣鹵肉飯,請(qǐng)給我食材表格、和做法時(shí)間步驟的思維導(dǎo)圖”。萬(wàn)知通過(guò)表格呈現(xiàn)了鹵肉飯的食譜,還通過(guò)思維導(dǎo)圖呈現(xiàn)了制作的步驟。

在回答關(guān)于北京的熱門(mén)演出時(shí),萬(wàn)知給出了具體的活動(dòng)時(shí)間、地點(diǎn),還會(huì)有甘特圖呈現(xiàn)出來(lái),用戶根據(jù)自己的時(shí)間空閑就能清晰看到演出的具體信息。

萬(wàn)知也可以快速閱讀理解PDF文檔、理解圖表。將PDF文檔上傳后,萬(wàn)知在閱讀完成后,右邊就會(huì)生成總結(jié)和建議提問(wèn)。

面對(duì)PDF中的單一圖表,萬(wàn)知會(huì)根據(jù)上下文生成內(nèi)容,如下圖中“關(guān)于2010年至2022年間按地理區(qū)域劃分的被授予AI專利百分比”的圖表,萬(wàn)知會(huì)給出圖表的來(lái)源以及其中呈現(xiàn)出的明顯趨勢(shì)供用戶理解。

此外,萬(wàn)知作為生產(chǎn)力工具的場(chǎng)景中,還能快速生成PPT,當(dāng)為學(xué)生介紹什么是AI,PPT內(nèi)容需要深入淺出,還要有精彩的圖片。萬(wàn)知首先會(huì)自動(dòng)總結(jié)PPT內(nèi)容應(yīng)該涵蓋的重點(diǎn),然后直接生成PPT。用戶如果對(duì)PPT中某一頁(yè)圖片不滿意,也可以通過(guò)AI增強(qiáng)搜圖快速換圖。

李開(kāi)復(fù)稱,萬(wàn)知生成的PPT比微軟Office Copilot的效果更好,一個(gè)PPT的制作時(shí)間大概在1-2分鐘左右。

03.大模型走向普惠,AI 2.0時(shí)代TC-PMF成關(guān)鍵

關(guān)于對(duì)未來(lái)的沉淀和展望,李開(kāi)復(fù)談道,最近有一個(gè)熱門(mén)的討論:一些人認(rèn)為我們應(yīng)該瘋狂追求AGI,AGI一旦發(fā)生就會(huì)改寫(xiě)全部;另一部分人認(rèn)為模型做得越大越難用,我們應(yīng)該快速找到PMF(產(chǎn)品市場(chǎng)匹配度)。

他認(rèn)為,這兩種觀點(diǎn)都對(duì),但都不完整,沒(méi)有一家公司可以只靠技術(shù)長(zhǎng)期領(lǐng)跑所有公司,一定是靠非技術(shù)優(yōu)勢(shì),也就是最終產(chǎn)品的勝出。

因此,企業(yè)不能忘記PMF重要性,但在AI 2.0時(shí)代還需要考慮TC-PMF(Product-Market-Technology-Cost Fit,技術(shù)成本 X產(chǎn)品市場(chǎng)契合度),其中T代表技術(shù),C代表成本。

今天模型基于Scaling Law在快速演進(jìn),企業(yè)需要不斷預(yù)測(cè)未來(lái)技術(shù)的走向,同時(shí)整個(gè)行業(yè)的推理成本過(guò)高,社交、電商、短視頻等很多應(yīng)用無(wú)法全面嵌入AI,企業(yè)需要不斷降低推理成本。

在應(yīng)用方面,一般來(lái)說(shuō)要實(shí)現(xiàn)最佳的AI-First應(yīng)用,需要頂級(jí)模型才能實(shí)現(xiàn)。但有時(shí)候一些應(yīng)用會(huì)先爆發(fā),可以在更小的模型上實(shí)現(xiàn)。

針對(duì)上述這些現(xiàn)象與行業(yè)的痛點(diǎn),李開(kāi)復(fù)剖析了零一萬(wàn)物一直以來(lái)堅(jiān)持的4個(gè)發(fā)展原則。

首先,零一萬(wàn)物的產(chǎn)品面向全世界,其單一產(chǎn)品今年收入達(dá)到1億人民幣,產(chǎn)品ROI接近1,上線9個(gè)月海外產(chǎn)品用戶數(shù)已經(jīng)接近千萬(wàn)。

第二個(gè)特點(diǎn)是?;步?,李開(kāi)復(fù)談道,國(guó)外大廠的GPU數(shù)量達(dá)到國(guó)內(nèi)創(chuàng)企的10倍以上,在這樣的背景下,零一萬(wàn)物的模型和推理團(tuán)隊(duì)有基本一樣的規(guī)模。

在訓(xùn)練方面,零一萬(wàn)物此前和英偉達(dá)合作,成為全球前三實(shí)現(xiàn)FP8訓(xùn)練的,也就是說(shuō)可以從頭到尾使用FP8精度實(shí)現(xiàn)更快速訓(xùn)練。他補(bǔ)充道,在這一技術(shù)的累積下, 其訓(xùn)練成本相比同行能低一半左右。

第三個(gè)特點(diǎn)是持續(xù)重視用戶體驗(yàn),模型的價(jià)值產(chǎn)生在對(duì)用戶的價(jià)值,一個(gè)很典型的功能就是萬(wàn)知對(duì)于圖表的分析,而不是普通照片的理解。

最后,對(duì)所有大模型玩家的一個(gè)考驗(yàn)是,企業(yè)需要考慮如何同時(shí)開(kāi)發(fā)產(chǎn)品、了解市場(chǎng)和用戶,還要關(guān)注技術(shù)發(fā)展的速度以及模型能力的演進(jìn)、成本下降等。這里所需要的能力Know-How,包括足夠的前瞻性,還需要是否可以以獨(dú)立的力量實(shí)現(xiàn)、執(zhí)行力等。

李開(kāi)復(fù)認(rèn)為,在此基礎(chǔ)上,零一萬(wàn)物有四大優(yōu)勢(shì),零一萬(wàn)物的技術(shù)、產(chǎn)品以及創(chuàng)新工廠的研究人員可以預(yù)測(cè)技術(shù)發(fā)展趨勢(shì)、對(duì)產(chǎn)品的打磨能力和耐心、投資人的預(yù)測(cè)能力、推理團(tuán)隊(duì)不斷降低推理成本。談到大模型能力轉(zhuǎn)化為生產(chǎn)力所看重的市場(chǎng)反饋與數(shù)據(jù)指標(biāo),零一萬(wàn)物生產(chǎn)力產(chǎn)品負(fù)責(zé)人曹大鵬分享說(shuō),產(chǎn)品在0-1階段重點(diǎn)關(guān)注長(zhǎng)期留存率,包括能否產(chǎn)生用戶自發(fā)傳播的口碑,在1-100階段會(huì)更關(guān)注增長(zhǎng)速度是否足夠快、商業(yè)模式和付費(fèi)轉(zhuǎn)化等指標(biāo)。在打造AI-First應(yīng)用時(shí),零一萬(wàn)物看重技術(shù)和成本,既要在模型能力上達(dá)到全球領(lǐng)先水平,又要從用戶視角出發(fā),降低價(jià)格同時(shí)質(zhì)量滿足用戶需求。

04.結(jié)語(yǔ):開(kāi)閉源矩陣雙輪驅(qū)動(dòng),零一萬(wàn)物瞄準(zhǔn)AI原生應(yīng)用

成立一年,零一萬(wàn)物的產(chǎn)品矩陣擁有開(kāi)源、閉源模型,且應(yīng)用方向涵蓋B端、C端,其正在基于底層大模型強(qiáng)大的理解推理能力,去挖掘用戶日常的核心痛點(diǎn),如制作PPT、分析圖表等,使得AI原生的應(yīng)用真正出現(xiàn)。今年以來(lái),在全面趕超國(guó)外頂尖大模型的同時(shí),國(guó)內(nèi)諸多大模型應(yīng)用爆發(fā),深入用戶生活、工作的方方面面,產(chǎn)業(yè)競(jìng)爭(zhēng)的焦點(diǎn)正在轉(zhuǎn)移,未來(lái)隨著模型性能的進(jìn)一步增強(qiáng),以及這些應(yīng)用與用戶的距離被拉近,AI原生應(yīng)用的更多高價(jià)值場(chǎng)景將被挖掘出來(lái)。

相關(guān)推薦

電子產(chǎn)業(yè)圖譜