作者?|??三北,編輯?|??漠影
中國(guó)需要什么樣的大模型?三路玩家答案只有一個(gè)。
隨著「百模大戰(zhàn)」狂飆200多天,國(guó)內(nèi)大模型產(chǎn)業(yè)正以超乎想象的速度發(fā)展。
大模型數(shù)量不斷膨脹,根據(jù)國(guó)研經(jīng)濟(jì)研究院10月23日發(fā)布的最新報(bào)告,我國(guó)大模型截至2023年8月已達(dá)156個(gè),超10億級(jí)參數(shù)的大模型超80個(gè),比肩美國(guó)?!赴倌4髴?zhàn)」進(jìn)入深水區(qū),形成了互聯(lián)網(wǎng)大廠、科技行業(yè)龍頭、AI創(chuàng)企三路玩家割據(jù),在能力上對(duì)標(biāo)GPT-4,在產(chǎn)業(yè)化實(shí)戰(zhàn)中混戰(zhàn)的格局。
當(dāng)下AI正成為國(guó)家「新基建」的重要部分。大量算力設(shè)施在加速建設(shè)和啟用,海量的數(shù)據(jù)不眠不休地在萬(wàn)卡集群流轉(zhuǎn)。國(guó)內(nèi)鍛造的大模型與GPT-4還有多遠(yuǎn)的距離?同時(shí),在全球AI競(jìng)賽激烈、供應(yīng)鏈緊張的背景下,中國(guó)需要什么樣的大模型?這些都成為產(chǎn)業(yè)迫切探討的問(wèn)題。
每一家大模型企業(yè)都在尋找大模型的中國(guó)方案,作為AI國(guó)家隊(duì)的科大訊飛也不例外。隨著全面對(duì)標(biāo)ChatGPT的訊飛星火認(rèn)知大模型V3.0面世,面向醫(yī)療、教育、工業(yè)等各行各業(yè)的行業(yè)大模型進(jìn)入人們的生產(chǎn)和生活,訊飛也與17+萬(wàn)新增大模型開(kāi)發(fā)者、10萬(wàn)+企業(yè)客戶(hù)一起,交出了一張「新答卷」。
01.「百模大戰(zhàn)』進(jìn)入深水區(qū),三路玩家混戰(zhàn)
人工智能從1956年被正式提出以來(lái),經(jīng)歷了數(shù)十年的發(fā)展歷程。大模型的誕生,一舉實(shí)現(xiàn)統(tǒng)計(jì)學(xué)習(xí)流派成果的集大成,成為當(dāng)下AI研究和開(kāi)發(fā)的最有力武器,也成為各大科技公司的必爭(zhēng)市場(chǎng)。
根據(jù)行研機(jī)構(gòu)IDC今年8月發(fā)布的報(bào)告,2022年全球人工智能IT總投資規(guī)模為1288億美元(約合9422億元人民幣),在大模型的推動(dòng)下2027年預(yù)計(jì)增至4236億美元(約合3.1萬(wàn)億元人民幣)。事實(shí)上,圍繞大模型的全球AI競(jìng)賽已經(jīng)愈演愈烈。不僅微軟及OpenAI、谷歌、Meta等企業(yè)之間打得正激烈,多國(guó)政界高層也已發(fā)聲,推動(dòng)新政策、聯(lián)盟和國(guó)家項(xiàng)目的建設(shè)。
而我國(guó),同樣迫切需要大模型。
浩浩蕩蕩的「百模大戰(zhàn)」在我國(guó)已打響半年,在中央和地方的多重政策指引下,各個(gè)領(lǐng)域的「頭雁」已經(jīng)加入探索中國(guó)大模型方案的浪潮之中。
在「百模大戰(zhàn)」狂飆的200多天里,我們看到有三路玩家沖出重圍,分別是:以百度、阿里等為代表的互聯(lián)網(wǎng)大廠,以華為、訊飛等為代表的科技行業(yè)龍頭,還有智譜AI、百川智能等一眾AI創(chuàng)企。
誰(shuí)能夠打造出中國(guó)最需要的大模型?
我們看到,三路大軍探索了自然語(yǔ)言、視覺(jué)和多模態(tài)不同方向,也正進(jìn)入互聯(lián)網(wǎng)、醫(yī)療、金融、教育、工業(yè)等各個(gè)行業(yè)領(lǐng)域。而隨著8月15日工信部等七部門(mén)聯(lián)合發(fā)布的《生成式人工智能服務(wù)管理暫行辦法》施行,一些頭部選手的大模型紛紛面向公眾開(kāi)放,包括百度、智譜AI、科大訊飛、商湯科技、阿里云、百川智能、MiniMax、抖音、中科院、上海AI實(shí)驗(yàn)室等首批開(kāi)放企業(yè)都在爭(zhēng)搶「第一梯隊(duì)」的名額。
一個(gè)初步的大模型「第一梯隊(duì)」玩家陣營(yíng)已經(jīng)出現(xiàn)。
劉聰告訴智東西,當(dāng)下大模型產(chǎn)業(yè)正處于大浪淘沙的關(guān)鍵階段。根據(jù)新華社聯(lián)合北大最新發(fā)布的《人工智能大模型體驗(yàn)報(bào)告2.0》報(bào)告,基于基礎(chǔ)能力指數(shù)、智商指數(shù)、情商指數(shù)、工具提效指數(shù)四大維度測(cè)評(píng),訊飛、百度、商湯、智譜的大模型綜合能力已居于前列。
▲《人工智能大模型體驗(yàn)報(bào)告2.0》主流大模型綜合指數(shù)2.0
更值得一提的是,這些大模型之間已經(jīng)出現(xiàn)了打法和效果上的差異。根據(jù)《人工智能大模型體驗(yàn)報(bào)告2.0》報(bào)告,百度文心一言地基深厚、基礎(chǔ)能力仍處領(lǐng)軍水準(zhǔn);商湯商量在情商方面表現(xiàn)優(yōu)秀;智譜在智商能力方面表現(xiàn)較好;科大訊飛的星火在工作提效方面優(yōu)勢(shì)明顯。
在10月23日國(guó)研經(jīng)濟(jì)研究院最新發(fā)布的測(cè)評(píng)中,訊飛星火大模型則大幅超越ChatGPT,并在部分行業(yè)優(yōu)于GPT-4,該榜單主要針對(duì)的是法律服務(wù)、工業(yè)設(shè)計(jì)、醫(yī)療、教育、零售、汽車(chē)工程、計(jì)算機(jī)7個(gè)行業(yè)的測(cè)評(píng)。
分野初現(xiàn),那么中國(guó)究竟需要什么樣的大模型?答案正變得日益明晰。
02.國(guó)產(chǎn)大模型圍攻GPT
中國(guó)需要的大模型,首先是能力強(qiáng)大的模型。
各家大模型的功能定義有所區(qū)別,但無(wú)一例外都將技術(shù)對(duì)標(biāo)OpenAI的GPT。
在AI領(lǐng)域深耕多年的科大訊飛董事長(zhǎng)劉慶峰認(rèn)為,國(guó)產(chǎn)大模型必須正視和GPT-4的差距。國(guó)產(chǎn)大模型在復(fù)雜知識(shí)推理、小樣本快速學(xué)習(xí)、超長(zhǎng)文本處理、跨模態(tài)統(tǒng)一理解上距GPT-4還有差距。唯有實(shí)事求是的科學(xué)精神,才能真正實(shí)現(xiàn)超越。
科大訊飛星火認(rèn)知大模型V3.0從文本生成、語(yǔ)言理解、知識(shí)問(wèn)答、邏輯推理、數(shù)學(xué)能力、代碼能力、多模態(tài)能力七大能力方面進(jìn)行了攻關(guān),全面對(duì)標(biāo)ChatGPT,據(jù)稱(chēng)目前中文能力客觀評(píng)測(cè)已超越ChatGPT,英文能力對(duì)標(biāo)ChatGPT的48項(xiàng)任務(wù)結(jié)果相當(dāng)。
背后,大模型的迭代要求研發(fā)團(tuán)隊(duì)從數(shù)學(xué)自動(dòng)提煉規(guī)律、小樣本學(xué)習(xí)、代碼項(xiàng)目級(jí)理解能力、多模態(tài)指令跟隨與細(xì)節(jié)表達(dá)等各種細(xì)分能力著手,逐個(gè)攻關(guān)。
綜合應(yīng)用迭代之后的大模型多項(xiàng)能力,用戶(hù)能夠做很多原本無(wú)法完成的創(chuàng)作。比如人機(jī)協(xié)同創(chuàng)作繪本故事,輸入簡(jiǎn)單的提示詞,就能連續(xù)生成圖文并茂的故事。文字故事的上下連續(xù)性,繪圖中人物形象的連續(xù)性,都來(lái)自星火大模型的認(rèn)知能力。
而當(dāng)大模型的能力起來(lái)之后,如何讓大模型體驗(yàn)更好?
訊飛主張根據(jù)海量用戶(hù)反饋?zhàn)龃竽P蜕?jí)。比如自訊飛星火9月5日全民開(kāi)放至今已有1200萬(wàn)用戶(hù),他們對(duì)認(rèn)知大模型提出了更高期待:不僅能回答問(wèn)題,還要能提出問(wèn)題;不僅要有知識(shí),還要有個(gè)性。
這讓訊飛意識(shí)到了“人格化”對(duì)AI大模型產(chǎn)品的重要性。為此,訊飛星火大模型V3.0新增了AI人設(shè)功能,它可以根據(jù)性格模擬、情緒理解、表達(dá)風(fēng)格來(lái)形成一個(gè)初始人設(shè),再結(jié)合特定知識(shí)學(xué)習(xí)、對(duì)話記憶學(xué)習(xí),形成一個(gè)更個(gè)性化的AI人設(shè)。
比如基于AI人設(shè)應(yīng)用助手“友伴”,創(chuàng)建一個(gè)自己的人設(shè)助手,上傳個(gè)人背景知識(shí),大模型便能用本人的風(fēng)格進(jìn)行對(duì)話。當(dāng)創(chuàng)建一個(gè)“孔夫子”助手來(lái)寫(xiě)發(fā)言稿時(shí),孔夫子的聲音和語(yǔ)言風(fēng)格便展現(xiàn)出來(lái)。
可以看到,國(guó)產(chǎn)大模型正逐漸找到自己的能力圈。
而隨著國(guó)內(nèi)大模型找到發(fā)展之路,國(guó)外的OpenAI也正憑借GPT技術(shù)起飛。
據(jù)外媒The Information報(bào)道,OpenAI的首席執(zhí)行官薩姆?阿爾特曼(Sam Altman)10月對(duì)其員工透露,OpenAI今年?duì)I收達(dá)到了13億美元,同比增長(zhǎng)超4500%,這將支持OpenAI進(jìn)一步計(jì)劃融資超千億美元。OpenAI讓中國(guó)企業(yè)看到了大模型技術(shù)的可觀商業(yè)前景,也感受到了產(chǎn)業(yè)化落地的壓力。
中國(guó)的大模型能否像OpenAI在商業(yè)中取得初步成功?
訊飛已用行動(dòng)給出了篤定的答案:對(duì)標(biāo)GPT-4的更大參數(shù)規(guī)模的星火大模型正式啟動(dòng)訓(xùn)練,2024年將實(shí)現(xiàn)對(duì)標(biāo)GPT-4。與此同時(shí),星火大模型的產(chǎn)業(yè)化也已經(jīng)同步展開(kāi)。
03.從工業(yè)生產(chǎn)到社會(huì)剛需,大模型跑出中國(guó)化道路
中國(guó)需要的大模型,是用技術(shù)創(chuàng)新去解放生產(chǎn)力的大模型。
AI正上升為國(guó)家政策導(dǎo)向,大模型日益以「新基建」的模式服務(wù)社會(huì)。高層強(qiáng)調(diào)人工智能是新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動(dòng)力量,各地政府此前已經(jīng)陸續(xù)推出了大模型相關(guān)行動(dòng)方案,通過(guò)算力券、資金補(bǔ)貼、產(chǎn)業(yè)場(chǎng)景扶助等方式支持大模型發(fā)展;一些城市如上海已率先將發(fā)展大模型寫(xiě)進(jìn)新基建行動(dòng)方案,以推動(dòng)大模型融入產(chǎn)業(yè)升級(jí)和社會(huì)生產(chǎn)力發(fā)展。
訊飛明確提出要將星火認(rèn)知大模型打造成解放生產(chǎn)力的工具,且從推出第一天起就聚焦應(yīng)用落地。
隨著訊飛星火App推出,其用戶(hù)使用的高峰期集中在"10 點(diǎn)、15 點(diǎn)"兩個(gè)辦公時(shí)段,印證了訊飛星火大模型更貼合“解放生產(chǎn)力、釋放想象力”的需求。隨著技術(shù)的進(jìn)步持續(xù)推動(dòng)應(yīng)用落地,星火認(rèn)知大模型在解決教育、醫(yī)療等社會(huì)剛需等問(wèn)題上日益深入。
1、面向工業(yè)、科研領(lǐng)域,大模型助力降本增效
隨著產(chǎn)業(yè)數(shù)字化和數(shù)字產(chǎn)業(yè)化發(fā)展,中國(guó)軟件從業(yè)人員快速增長(zhǎng),已有約800萬(wàn)人,2022年軟件業(yè)務(wù)收入10.8萬(wàn)億元。為此,大模型在工業(yè)領(lǐng)域首先要賦能代碼。
過(guò)去半年來(lái),我們看到Copilot X等多種編程輔助工具誕生,而基于訊飛星火V3.0的智能編程助手iFlyCode2.0則再攀高峰。據(jù)稱(chēng),其在編程的設(shè)計(jì)階段提效50%、編碼階段提效37%、測(cè)試階段提效44%。iFlyCode推出以來(lái),已在京東云、軟通動(dòng)力等107家機(jī)構(gòu)實(shí)現(xiàn)深度對(duì)接應(yīng)用。
科學(xué)技術(shù)是第一生產(chǎn)力,大模型也在為科研人員“加Buff”。
當(dāng)下,科學(xué)技術(shù)在大國(guó)角逐中的地位越來(lái)越重要。而在科研領(lǐng)域,科研人員往往會(huì)花大量的時(shí)間在資料的檢索和整理上。如果能將他們從中解放出來(lái),那么他們就能夠去研究解決更加“卡脖子”的問(wèn)題。
科技文獻(xiàn)是檢驗(yàn)大模型高階認(rèn)知能力的“試金石”,也成為大模型企業(yè)重要的落地方向。以訊飛星火和與中科院文獻(xiàn)情報(bào)中心聯(lián)合打造的科技文獻(xiàn)大模型為例,其可以實(shí)現(xiàn)成果調(diào)研、論文研讀、學(xué)術(shù)寫(xiě)作三大功能。比如基于科技文獻(xiàn)大模型,可以將十幾份量子計(jì)算論文一鍵生成綜述報(bào)告,讓科研人員快速了解最新學(xué)術(shù)新知。測(cè)試顯示,基于科技文獻(xiàn)大模型,學(xué)者成果調(diào)研的效率可以提高超10倍,模型的論文研讀有效率和學(xué)術(shù)寫(xiě)作采納率均超90%。
2、面向教育、醫(yī)療領(lǐng)域,大模型滿足更廣大社會(huì)剛需
一個(gè)國(guó)家未來(lái)的科技發(fā)展、科學(xué)精神,應(yīng)該從娃娃抓起。通用人工智能時(shí)代,真正的“因材施教”、“個(gè)性化學(xué)習(xí)”有望進(jìn)一步實(shí)現(xiàn)。比如,訊飛AI學(xué)習(xí)機(jī)主推的「啟發(fā)互動(dòng)式英語(yǔ)AI答疑輔學(xué)」功能,就可以實(shí)現(xiàn)個(gè)性化解決、啟發(fā)引導(dǎo)式提問(wèn)、互動(dòng)探究式學(xué)習(xí)。
根據(jù)2023年9月安徽地區(qū)七八年級(jí)試點(diǎn)用戶(hù)的統(tǒng)計(jì)數(shù)據(jù)顯示,基于AI答疑輔學(xué)功能,小學(xué)英語(yǔ)錯(cuò)題解決率提升了13%,初中英語(yǔ)錯(cuò)題解決率提升了61%。
如何緩解醫(yī)療資源緊張的問(wèn)題?大模型現(xiàn)在也能起到作用。
在醫(yī)療領(lǐng)域,訊飛的星火醫(yī)療大模型和基于星火醫(yī)療大模型的“訊飛曉醫(yī)”APP開(kāi)辟了問(wèn)診新路徑。它支持人們?cè)诳床≈啊⒂盟幱幸蓡?wèn)、解析體檢報(bào)告的時(shí)候進(jìn)行建議詢(xún)問(wèn)。據(jù)悉,通過(guò)上線實(shí)際使用數(shù)據(jù)抽查12萬(wàn)例并通過(guò)STI第三方測(cè)試,訊飛星火醫(yī)療大模型在醫(yī)療海量知識(shí)問(wèn)答、醫(yī)療復(fù)雜語(yǔ)言理解等方面全面超越GPT-4。
大模型的落地領(lǐng)域還有很多,等待更多產(chǎn)業(yè)玩家一起探索。科大訊飛看準(zhǔn)了包含金融、汽車(chē)、運(yùn)營(yíng)商、工業(yè)、住建、物業(yè)、法律等行業(yè),聯(lián)合行業(yè)龍頭共同推出了12個(gè)行業(yè)大模型,加速產(chǎn)業(yè)升級(jí)。
值得一提的是,認(rèn)知大模型在行業(yè)深度應(yīng)用的關(guān)鍵,無(wú)疑是安全可控、場(chǎng)景驅(qū)動(dòng)、專(zhuān)屬可控。
其中安全可控的前提就是算力可控。我們看到,訊飛選擇和華為在AI算力底座上打造基于昇騰生態(tài)的“飛星一號(hào)”大模型算力平臺(tái),正是為大模型在行業(yè)的深度應(yīng)用提供了保障。
最后,探索大模型落地應(yīng)用的中國(guó)方案,離不開(kāi)整個(gè)生態(tài)的支持。
目前只有少數(shù)幾家大模型頭部玩家公布了最新生態(tài)建設(shè)情況。根據(jù)訊飛官方數(shù)據(jù),自5月6日星火發(fā)布以來(lái),訊飛開(kāi)放平臺(tái)新增143萬(wàn)開(kāi)發(fā)者團(tuán)隊(duì),同比增幅331%,匯聚553萬(wàn)AI生態(tài)開(kāi)發(fā)者團(tuán)隊(duì)。其中新增大模型開(kāi)發(fā)者17.8萬(wàn),訊飛正與10萬(wàn)+企業(yè)客戶(hù)用星火創(chuàng)新應(yīng)用新體驗(yàn)。
今年5月6日,訊飛發(fā)布星火認(rèn)知大模型1.0版本,當(dāng)時(shí)劉慶峰提出要「追趕并努力超越OpenAI」的目標(biāo),并放出在10月24日開(kāi)發(fā)者節(jié)發(fā)布趕超ChatGPT的星火大模型的狠話,時(shí)隔近半年,訊飛果然兌現(xiàn)了承諾,交出大模型中國(guó)方案的「新答卷」。
訊飛為什么能夠一一兌現(xiàn)這些承諾?劉慶峰在此前的一次講話中總結(jié)了訊飛做大模型的三點(diǎn)心得:
1、首先是訊飛所有的算法都自主可控,這次星火大模型的每一行代碼、每一個(gè)算法模塊都是訊飛自己做的。
2、訊飛有成建制的團(tuán)隊(duì),訊飛還有像華為這樣的深度合作伙伴,正因?yàn)橛羞@些,訊飛才能夠有底氣說(shuō)我下一階段做到多少。
3、因?yàn)槌思夹g(shù)、人才和伙伴之外,最重要的就是一定要完成任務(wù),絕不服輸,要做就勇?tīng)?zhēng)第一的精神,這就是中國(guó)通用人工智能未來(lái)的希望。
04.結(jié)語(yǔ):理性看待與GPT的差距,著眼社會(huì)剛需發(fā)展大模型
當(dāng)下,大模型產(chǎn)業(yè)面臨激烈的算法競(jìng)爭(zhēng)、嚴(yán)峻的算力限制、尚待發(fā)展成熟數(shù)據(jù)市場(chǎng),都促使我們從根源處思考,中國(guó)究竟需要什么樣的大模型?
從中國(guó)經(jīng)濟(jì)的基本面來(lái)看,當(dāng)前要提升實(shí)體經(jīng)濟(jì)投資回報(bào)率和提高勞動(dòng)生產(chǎn)率,就需要在供給側(cè)結(jié)構(gòu)性改革等供給層面下功夫。正如望正資本全球宏觀對(duì)沖基金董事長(zhǎng)劉陳杰在中國(guó)宏觀經(jīng)濟(jì)論壇所說(shuō),AI將成為一輪供給側(cè)結(jié)構(gòu)性改革2.0版本,特別是在發(fā)揮全要素生產(chǎn)力方面,AI將發(fā)揮特別重要的不可替代的作用。
要服務(wù)社會(huì)生產(chǎn)力,大模型能力的及格關(guān)仍是第一步。誠(chéng)然,國(guó)內(nèi)「百模大戰(zhàn)」中已經(jīng)涌現(xiàn)出一批具有趕超GPT勢(shì)頭的玩家,但我們?nèi)孕枰硇钥创鶪PT的差距。以訊飛、百度、智譜AI等為代表的一梯隊(duì)玩家從技術(shù)、產(chǎn)業(yè)和生態(tài)層面給出了有策略地進(jìn)行超車(chē)方案,也做出了大模型與社會(huì)剛需相結(jié)合的價(jià)值選擇。
訊飛給出的大模型中國(guó)方案兼顧了這些問(wèn)題的方方面面。首先,中國(guó)需要在正視GPT-4的基礎(chǔ)上,打造自主創(chuàng)新、安全可控、不斷超越的大模型;其次,大模型要聚焦社會(huì)剛需的解決,而不是僅用于社交文娛等輕松領(lǐng)域;而從更宏觀層面說(shuō),中國(guó)真正需要的是解決生產(chǎn)力的大模型,促進(jìn)中國(guó)產(chǎn)業(yè)的新升級(jí)。
值得一提的是,大模型在真正轉(zhuǎn)化為生產(chǎn)力的過(guò)程中還會(huì)面臨一系列新挑戰(zhàn)。正如復(fù)旦大學(xué)人工智能創(chuàng)新與產(chǎn)業(yè)研究院院長(zhǎng)漆遠(yuǎn)的觀點(diǎn),如何避免大模型出現(xiàn)的“幻覺(jué)效應(yīng)”?對(duì)于復(fù)雜的應(yīng)用場(chǎng)景如何實(shí)現(xiàn)信息的動(dòng)態(tài)集成,包括代理如何調(diào)用外部數(shù)據(jù)庫(kù),大模型本身如何快速、動(dòng)態(tài)地集成和更新?海量數(shù)據(jù)的獲取和算力方面問(wèn)題如何解決?
這些都是大模型在研發(fā)和落地過(guò)程中難以繞過(guò)的挑戰(zhàn),也將成為中國(guó)大模型們需要直面的問(wèn)題。