作者?|??三北,編輯?|??漠影
中國需要什么樣的大模型?三路玩家答案只有一個(gè)。
隨著「百模大戰(zhàn)」狂飆200多天,國內(nèi)大模型產(chǎn)業(yè)正以超乎想象的速度發(fā)展。
大模型數(shù)量不斷膨脹,根據(jù)國研經(jīng)濟(jì)研究院10月23日發(fā)布的最新報(bào)告,我國大模型截至2023年8月已達(dá)156個(gè),超10億級參數(shù)的大模型超80個(gè),比肩美國。「百模大戰(zhàn)」進(jìn)入深水區(qū),形成了互聯(lián)網(wǎng)大廠、科技行業(yè)龍頭、AI創(chuàng)企三路玩家割據(jù),在能力上對標(biāo)GPT-4,在產(chǎn)業(yè)化實(shí)戰(zhàn)中混戰(zhàn)的格局。
當(dāng)下AI正成為國家「新基建」的重要部分。大量算力設(shè)施在加速建設(shè)和啟用,海量的數(shù)據(jù)不眠不休地在萬卡集群流轉(zhuǎn)。國內(nèi)鍛造的大模型與GPT-4還有多遠(yuǎn)的距離?同時(shí),在全球AI競賽激烈、供應(yīng)鏈緊張的背景下,中國需要什么樣的大模型?這些都成為產(chǎn)業(yè)迫切探討的問題。
每一家大模型企業(yè)都在尋找大模型的中國方案,作為AI國家隊(duì)的科大訊飛也不例外。隨著全面對標(biāo)ChatGPT的訊飛星火認(rèn)知大模型V3.0面世,面向醫(yī)療、教育、工業(yè)等各行各業(yè)的行業(yè)大模型進(jìn)入人們的生產(chǎn)和生活,訊飛也與17+萬新增大模型開發(fā)者、10萬+企業(yè)客戶一起,交出了一張「新答卷」。
01.「百模大戰(zhàn)』進(jìn)入深水區(qū),三路玩家混戰(zhàn)
人工智能從1956年被正式提出以來,經(jīng)歷了數(shù)十年的發(fā)展歷程。大模型的誕生,一舉實(shí)現(xiàn)統(tǒng)計(jì)學(xué)習(xí)流派成果的集大成,成為當(dāng)下AI研究和開發(fā)的最有力武器,也成為各大科技公司的必爭市場。
根據(jù)行研機(jī)構(gòu)IDC今年8月發(fā)布的報(bào)告,2022年全球人工智能IT總投資規(guī)模為1288億美元(約合9422億元人民幣),在大模型的推動下2027年預(yù)計(jì)增至4236億美元(約合3.1萬億元人民幣)。事實(shí)上,圍繞大模型的全球AI競賽已經(jīng)愈演愈烈。不僅微軟及OpenAI、谷歌、Meta等企業(yè)之間打得正激烈,多國政界高層也已發(fā)聲,推動新政策、聯(lián)盟和國家項(xiàng)目的建設(shè)。
而我國,同樣迫切需要大模型。
浩浩蕩蕩的「百模大戰(zhàn)」在我國已打響半年,在中央和地方的多重政策指引下,各個(gè)領(lǐng)域的「頭雁」已經(jīng)加入探索中國大模型方案的浪潮之中。
在「百模大戰(zhàn)」狂飆的200多天里,我們看到有三路玩家沖出重圍,分別是:以百度、阿里等為代表的互聯(lián)網(wǎng)大廠,以華為、訊飛等為代表的科技行業(yè)龍頭,還有智譜AI、百川智能等一眾AI創(chuàng)企。
誰能夠打造出中國最需要的大模型?
我們看到,三路大軍探索了自然語言、視覺和多模態(tài)不同方向,也正進(jìn)入互聯(lián)網(wǎng)、醫(yī)療、金融、教育、工業(yè)等各個(gè)行業(yè)領(lǐng)域。而隨著8月15日工信部等七部門聯(lián)合發(fā)布的《生成式人工智能服務(wù)管理暫行辦法》施行,一些頭部選手的大模型紛紛面向公眾開放,包括百度、智譜AI、科大訊飛、商湯科技、阿里云、百川智能、MiniMax、抖音、中科院、上海AI實(shí)驗(yàn)室等首批開放企業(yè)都在爭搶「第一梯隊(duì)」的名額。
一個(gè)初步的大模型「第一梯隊(duì)」玩家陣營已經(jīng)出現(xiàn)。
劉聰告訴智東西,當(dāng)下大模型產(chǎn)業(yè)正處于大浪淘沙的關(guān)鍵階段。根據(jù)新華社聯(lián)合北大最新發(fā)布的《人工智能大模型體驗(yàn)報(bào)告2.0》報(bào)告,基于基礎(chǔ)能力指數(shù)、智商指數(shù)、情商指數(shù)、工具提效指數(shù)四大維度測評,訊飛、百度、商湯、智譜的大模型綜合能力已居于前列。
▲《人工智能大模型體驗(yàn)報(bào)告2.0》主流大模型綜合指數(shù)2.0
更值得一提的是,這些大模型之間已經(jīng)出現(xiàn)了打法和效果上的差異。根據(jù)《人工智能大模型體驗(yàn)報(bào)告2.0》報(bào)告,百度文心一言地基深厚、基礎(chǔ)能力仍處領(lǐng)軍水準(zhǔn);商湯商量在情商方面表現(xiàn)優(yōu)秀;智譜在智商能力方面表現(xiàn)較好;科大訊飛的星火在工作提效方面優(yōu)勢明顯。
在10月23日國研經(jīng)濟(jì)研究院最新發(fā)布的測評中,訊飛星火大模型則大幅超越ChatGPT,并在部分行業(yè)優(yōu)于GPT-4,該榜單主要針對的是法律服務(wù)、工業(yè)設(shè)計(jì)、醫(yī)療、教育、零售、汽車工程、計(jì)算機(jī)7個(gè)行業(yè)的測評。
分野初現(xiàn),那么中國究竟需要什么樣的大模型?答案正變得日益明晰。
02.國產(chǎn)大模型圍攻GPT
中國需要的大模型,首先是能力強(qiáng)大的模型。
各家大模型的功能定義有所區(qū)別,但無一例外都將技術(shù)對標(biāo)OpenAI的GPT。
在AI領(lǐng)域深耕多年的科大訊飛董事長劉慶峰認(rèn)為,國產(chǎn)大模型必須正視和GPT-4的差距。國產(chǎn)大模型在復(fù)雜知識推理、小樣本快速學(xué)習(xí)、超長文本處理、跨模態(tài)統(tǒng)一理解上距GPT-4還有差距。唯有實(shí)事求是的科學(xué)精神,才能真正實(shí)現(xiàn)超越。
科大訊飛星火認(rèn)知大模型V3.0從文本生成、語言理解、知識問答、邏輯推理、數(shù)學(xué)能力、代碼能力、多模態(tài)能力七大能力方面進(jìn)行了攻關(guān),全面對標(biāo)ChatGPT,據(jù)稱目前中文能力客觀評測已超越ChatGPT,英文能力對標(biāo)ChatGPT的48項(xiàng)任務(wù)結(jié)果相當(dāng)。
背后,大模型的迭代要求研發(fā)團(tuán)隊(duì)從數(shù)學(xué)自動提煉規(guī)律、小樣本學(xué)習(xí)、代碼項(xiàng)目級理解能力、多模態(tài)指令跟隨與細(xì)節(jié)表達(dá)等各種細(xì)分能力著手,逐個(gè)攻關(guān)。
綜合應(yīng)用迭代之后的大模型多項(xiàng)能力,用戶能夠做很多原本無法完成的創(chuàng)作。比如人機(jī)協(xié)同創(chuàng)作繪本故事,輸入簡單的提示詞,就能連續(xù)生成圖文并茂的故事。文字故事的上下連續(xù)性,繪圖中人物形象的連續(xù)性,都來自星火大模型的認(rèn)知能力。
而當(dāng)大模型的能力起來之后,如何讓大模型體驗(yàn)更好?
訊飛主張根據(jù)海量用戶反饋?zhàn)龃竽P蜕墶1热缱杂嶏w星火9月5日全民開放至今已有1200萬用戶,他們對認(rèn)知大模型提出了更高期待:不僅能回答問題,還要能提出問題;不僅要有知識,還要有個(gè)性。
這讓訊飛意識到了“人格化”對AI大模型產(chǎn)品的重要性。為此,訊飛星火大模型V3.0新增了AI人設(shè)功能,它可以根據(jù)性格模擬、情緒理解、表達(dá)風(fēng)格來形成一個(gè)初始人設(shè),再結(jié)合特定知識學(xué)習(xí)、對話記憶學(xué)習(xí),形成一個(gè)更個(gè)性化的AI人設(shè)。
比如基于AI人設(shè)應(yīng)用助手“友伴”,創(chuàng)建一個(gè)自己的人設(shè)助手,上傳個(gè)人背景知識,大模型便能用本人的風(fēng)格進(jìn)行對話。當(dāng)創(chuàng)建一個(gè)“孔夫子”助手來寫發(fā)言稿時(shí),孔夫子的聲音和語言風(fēng)格便展現(xiàn)出來。
可以看到,國產(chǎn)大模型正逐漸找到自己的能力圈。
而隨著國內(nèi)大模型找到發(fā)展之路,國外的OpenAI也正憑借GPT技術(shù)起飛。
據(jù)外媒The Information報(bào)道,OpenAI的首席執(zhí)行官薩姆?阿爾特曼(Sam Altman)10月對其員工透露,OpenAI今年?duì)I收達(dá)到了13億美元,同比增長超4500%,這將支持OpenAI進(jìn)一步計(jì)劃融資超千億美元。OpenAI讓中國企業(yè)看到了大模型技術(shù)的可觀商業(yè)前景,也感受到了產(chǎn)業(yè)化落地的壓力。
中國的大模型能否像OpenAI在商業(yè)中取得初步成功?
訊飛已用行動給出了篤定的答案:對標(biāo)GPT-4的更大參數(shù)規(guī)模的星火大模型正式啟動訓(xùn)練,2024年將實(shí)現(xiàn)對標(biāo)GPT-4。與此同時(shí),星火大模型的產(chǎn)業(yè)化也已經(jīng)同步展開。
03.從工業(yè)生產(chǎn)到社會剛需,大模型跑出中國化道路
中國需要的大模型,是用技術(shù)創(chuàng)新去解放生產(chǎn)力的大模型。
AI正上升為國家政策導(dǎo)向,大模型日益以「新基建」的模式服務(wù)社會。高層強(qiáng)調(diào)人工智能是新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動力量,各地政府此前已經(jīng)陸續(xù)推出了大模型相關(guān)行動方案,通過算力券、資金補(bǔ)貼、產(chǎn)業(yè)場景扶助等方式支持大模型發(fā)展;一些城市如上海已率先將發(fā)展大模型寫進(jìn)新基建行動方案,以推動大模型融入產(chǎn)業(yè)升級和社會生產(chǎn)力發(fā)展。
訊飛明確提出要將星火認(rèn)知大模型打造成解放生產(chǎn)力的工具,且從推出第一天起就聚焦應(yīng)用落地。
隨著訊飛星火App推出,其用戶使用的高峰期集中在"10 點(diǎn)、15 點(diǎn)"兩個(gè)辦公時(shí)段,印證了訊飛星火大模型更貼合“解放生產(chǎn)力、釋放想象力”的需求。隨著技術(shù)的進(jìn)步持續(xù)推動應(yīng)用落地,星火認(rèn)知大模型在解決教育、醫(yī)療等社會剛需等問題上日益深入。
1、面向工業(yè)、科研領(lǐng)域,大模型助力降本增效
隨著產(chǎn)業(yè)數(shù)字化和數(shù)字產(chǎn)業(yè)化發(fā)展,中國軟件從業(yè)人員快速增長,已有約800萬人,2022年軟件業(yè)務(wù)收入10.8萬億元。為此,大模型在工業(yè)領(lǐng)域首先要賦能代碼。
過去半年來,我們看到Copilot X等多種編程輔助工具誕生,而基于訊飛星火V3.0的智能編程助手iFlyCode2.0則再攀高峰。據(jù)稱,其在編程的設(shè)計(jì)階段提效50%、編碼階段提效37%、測試階段提效44%。iFlyCode推出以來,已在京東云、軟通動力等107家機(jī)構(gòu)實(shí)現(xiàn)深度對接應(yīng)用。
科學(xué)技術(shù)是第一生產(chǎn)力,大模型也在為科研人員“加Buff”。
當(dāng)下,科學(xué)技術(shù)在大國角逐中的地位越來越重要。而在科研領(lǐng)域,科研人員往往會花大量的時(shí)間在資料的檢索和整理上。如果能將他們從中解放出來,那么他們就能夠去研究解決更加“卡脖子”的問題。
科技文獻(xiàn)是檢驗(yàn)大模型高階認(rèn)知能力的“試金石”,也成為大模型企業(yè)重要的落地方向。以訊飛星火和與中科院文獻(xiàn)情報(bào)中心聯(lián)合打造的科技文獻(xiàn)大模型為例,其可以實(shí)現(xiàn)成果調(diào)研、論文研讀、學(xué)術(shù)寫作三大功能。比如基于科技文獻(xiàn)大模型,可以將十幾份量子計(jì)算論文一鍵生成綜述報(bào)告,讓科研人員快速了解最新學(xué)術(shù)新知。測試顯示,基于科技文獻(xiàn)大模型,學(xué)者成果調(diào)研的效率可以提高超10倍,模型的論文研讀有效率和學(xué)術(shù)寫作采納率均超90%。
2、面向教育、醫(yī)療領(lǐng)域,大模型滿足更廣大社會剛需
一個(gè)國家未來的科技發(fā)展、科學(xué)精神,應(yīng)該從娃娃抓起。通用人工智能時(shí)代,真正的“因材施教”、“個(gè)性化學(xué)習(xí)”有望進(jìn)一步實(shí)現(xiàn)。比如,訊飛AI學(xué)習(xí)機(jī)主推的「啟發(fā)互動式英語AI答疑輔學(xué)」功能,就可以實(shí)現(xiàn)個(gè)性化解決、啟發(fā)引導(dǎo)式提問、互動探究式學(xué)習(xí)。
根據(jù)2023年9月安徽地區(qū)七八年級試點(diǎn)用戶的統(tǒng)計(jì)數(shù)據(jù)顯示,基于AI答疑輔學(xué)功能,小學(xué)英語錯題解決率提升了13%,初中英語錯題解決率提升了61%。
如何緩解醫(yī)療資源緊張的問題?大模型現(xiàn)在也能起到作用。
在醫(yī)療領(lǐng)域,訊飛的星火醫(yī)療大模型和基于星火醫(yī)療大模型的“訊飛曉醫(yī)”APP開辟了問診新路徑。它支持人們在看病之前、用藥有疑問、解析體檢報(bào)告的時(shí)候進(jìn)行建議詢問。據(jù)悉,通過上線實(shí)際使用數(shù)據(jù)抽查12萬例并通過STI第三方測試,訊飛星火醫(yī)療大模型在醫(yī)療海量知識問答、醫(yī)療復(fù)雜語言理解等方面全面超越GPT-4。
大模型的落地領(lǐng)域還有很多,等待更多產(chǎn)業(yè)玩家一起探索??拼笥嶏w看準(zhǔn)了包含金融、汽車、運(yùn)營商、工業(yè)、住建、物業(yè)、法律等行業(yè),聯(lián)合行業(yè)龍頭共同推出了12個(gè)行業(yè)大模型,加速產(chǎn)業(yè)升級。
值得一提的是,認(rèn)知大模型在行業(yè)深度應(yīng)用的關(guān)鍵,無疑是安全可控、場景驅(qū)動、專屬可控。
其中安全可控的前提就是算力可控。我們看到,訊飛選擇和華為在AI算力底座上打造基于昇騰生態(tài)的“飛星一號”大模型算力平臺,正是為大模型在行業(yè)的深度應(yīng)用提供了保障。
最后,探索大模型落地應(yīng)用的中國方案,離不開整個(gè)生態(tài)的支持。
目前只有少數(shù)幾家大模型頭部玩家公布了最新生態(tài)建設(shè)情況。根據(jù)訊飛官方數(shù)據(jù),自5月6日星火發(fā)布以來,訊飛開放平臺新增143萬開發(fā)者團(tuán)隊(duì),同比增幅331%,匯聚553萬AI生態(tài)開發(fā)者團(tuán)隊(duì)。其中新增大模型開發(fā)者17.8萬,訊飛正與10萬+企業(yè)客戶用星火創(chuàng)新應(yīng)用新體驗(yàn)。
今年5月6日,訊飛發(fā)布星火認(rèn)知大模型1.0版本,當(dāng)時(shí)劉慶峰提出要「追趕并努力超越OpenAI」的目標(biāo),并放出在10月24日開發(fā)者節(jié)發(fā)布趕超ChatGPT的星火大模型的狠話,時(shí)隔近半年,訊飛果然兌現(xiàn)了承諾,交出大模型中國方案的「新答卷」。
訊飛為什么能夠一一兌現(xiàn)這些承諾?劉慶峰在此前的一次講話中總結(jié)了訊飛做大模型的三點(diǎn)心得:
1、首先是訊飛所有的算法都自主可控,這次星火大模型的每一行代碼、每一個(gè)算法模塊都是訊飛自己做的。
2、訊飛有成建制的團(tuán)隊(duì),訊飛還有像華為這樣的深度合作伙伴,正因?yàn)橛羞@些,訊飛才能夠有底氣說我下一階段做到多少。
3、因?yàn)槌思夹g(shù)、人才和伙伴之外,最重要的就是一定要完成任務(wù),絕不服輸,要做就勇爭第一的精神,這就是中國通用人工智能未來的希望。
04.結(jié)語:理性看待與GPT的差距,著眼社會剛需發(fā)展大模型
當(dāng)下,大模型產(chǎn)業(yè)面臨激烈的算法競爭、嚴(yán)峻的算力限制、尚待發(fā)展成熟數(shù)據(jù)市場,都促使我們從根源處思考,中國究竟需要什么樣的大模型?
從中國經(jīng)濟(jì)的基本面來看,當(dāng)前要提升實(shí)體經(jīng)濟(jì)投資回報(bào)率和提高勞動生產(chǎn)率,就需要在供給側(cè)結(jié)構(gòu)性改革等供給層面下功夫。正如望正資本全球宏觀對沖基金董事長劉陳杰在中國宏觀經(jīng)濟(jì)論壇所說,AI將成為一輪供給側(cè)結(jié)構(gòu)性改革2.0版本,特別是在發(fā)揮全要素生產(chǎn)力方面,AI將發(fā)揮特別重要的不可替代的作用。
要服務(wù)社會生產(chǎn)力,大模型能力的及格關(guān)仍是第一步。誠然,國內(nèi)「百模大戰(zhàn)」中已經(jīng)涌現(xiàn)出一批具有趕超GPT勢頭的玩家,但我們?nèi)孕枰硇钥创鶪PT的差距。以訊飛、百度、智譜AI等為代表的一梯隊(duì)玩家從技術(shù)、產(chǎn)業(yè)和生態(tài)層面給出了有策略地進(jìn)行超車方案,也做出了大模型與社會剛需相結(jié)合的價(jià)值選擇。
訊飛給出的大模型中國方案兼顧了這些問題的方方面面。首先,中國需要在正視GPT-4的基礎(chǔ)上,打造自主創(chuàng)新、安全可控、不斷超越的大模型;其次,大模型要聚焦社會剛需的解決,而不是僅用于社交文娛等輕松領(lǐng)域;而從更宏觀層面說,中國真正需要的是解決生產(chǎn)力的大模型,促進(jìn)中國產(chǎn)業(yè)的新升級。
值得一提的是,大模型在真正轉(zhuǎn)化為生產(chǎn)力的過程中還會面臨一系列新挑戰(zhàn)。正如復(fù)旦大學(xué)人工智能創(chuàng)新與產(chǎn)業(yè)研究院院長漆遠(yuǎn)的觀點(diǎn),如何避免大模型出現(xiàn)的“幻覺效應(yīng)”?對于復(fù)雜的應(yīng)用場景如何實(shí)現(xiàn)信息的動態(tài)集成,包括代理如何調(diào)用外部數(shù)據(jù)庫,大模型本身如何快速、動態(tài)地集成和更新?海量數(shù)據(jù)的獲取和算力方面問題如何解決?
這些都是大模型在研發(fā)和落地過程中難以繞過的挑戰(zhàn),也將成為中國大模型們需要直面的問題。