“我們總是高估兩年后的變化,低估未來十年的變革。”
在這個(gè)科學(xué)與資本和聚光燈緊密結(jié)合的時(shí)代,比爾·蓋茨的這句話非常貼切,尤其是過去幾年來的人工智能領(lǐng)域:
一方面,去年底今年初ChatGPT橫空出世,婦孺皆知,“所有業(yè)務(wù)都值得用人工智能重新做一遍”;
另一方面,對已經(jīng)真正在賽道上堅(jiān)持了十幾年、甚至幾十年長跑的選手來說,利用好當(dāng)下的聚光燈,在關(guān)鍵節(jié)點(diǎn)咬牙沖刺,為今后的賽程積攢更多能量和資源,才是內(nèi)行的門道。
對真正關(guān)心這項(xiàng)技術(shù)發(fā)展和競爭格局的朋友們來說,上月末國內(nèi)有一件大事,那就是科大訊飛一年一度的1024開發(fā)者節(jié)大會。
兩個(gè)背景讓這次大會更加引人注目,一是近期美國政府更新了出口管制規(guī)定,計(jì)劃阻止英偉達(dá)等公司向中國出口先進(jìn)算力芯片;二是在“一帶一路”大會上,中方提出《全球人工智能治理倡議》,站在國際社會大多數(shù)的立場上,宣示西方并非全球人工智能技術(shù)和生態(tài)的唯一選擇。
01. 科大訊飛的深耕與產(chǎn)業(yè)生態(tài)的共建
說回訊飛1024大會本身,會上氣氛熱烈,干貨很多,科工力量的小伙伴也受邀來到現(xiàn)場,也參與了董事長劉慶峰和研究院院長劉聰?shù)拈]門采訪,務(wù)實(shí)、坦誠、高效是這些技術(shù)大佬給人的印象。
我們在這一期希望把看到的亮點(diǎn)做一個(gè)簡單梳理,加上一些自己的理解,希望了解更完整內(nèi)容的小伙伴,可以移步科工力量B站官方,有一個(gè)半小時(shí)的發(fā)布會全程回顧。
首先是通用大模型技術(shù)本身。
本次,星火認(rèn)知大模型V3.0亮相,第三方評測認(rèn)定對標(biāo)ChatGPT(GPT3.5版本)實(shí)現(xiàn)整體能力超越,訊飛如期到達(dá)今年的第三座里程碑,劉慶峰在發(fā)布會上情緒激動(dòng),立下新的flag:明年上半年要對標(biāo)GPT-4。
為什么情緒激動(dòng)?因?yàn)檫@件事情很難,很重要。
我們先從澄清一個(gè)說法開始。
過去一段時(shí)間,很多報(bào)道喜歡渲染“百模大戰(zhàn)”,好像做大模型很容易,很多人都在做,這是很大的誤導(dǎo)。從技術(shù)角度,把大語言(LLM)底座模型、開源微調(diào)模型、行業(yè)垂直模型等不同類型大模型放在一起比較。是把不在一個(gè)難度級別的事情強(qiáng)拉在一起。
底座模型(LLM)是一種基礎(chǔ)的大模型,它已經(jīng)掌握了大量的通用知識,可以應(yīng)用于多個(gè)領(lǐng)域;開源微調(diào)模型是在底座模型基礎(chǔ)上進(jìn)行微調(diào)的模型;行業(yè)垂直模型針對特定行業(yè)或領(lǐng)域,如醫(yī)療、金融、法律、教育等。
在實(shí)際應(yīng)用中,如果只強(qiáng)調(diào)通用性,底座模型(LLM)更為合適;如果任務(wù)專注于某一特定領(lǐng)域,那么基于底座模型進(jìn)一步提煉行業(yè)垂直模型會有更好的表現(xiàn);而開源微調(diào)模型是更靈活的解決方案,可以在通用性和專業(yè)性之間取得平衡。
可見,對AI應(yīng)用來說,底座模型(LLM)是一種基礎(chǔ)設(shè)施,參數(shù)量巨大,需要的訓(xùn)練數(shù)據(jù)量也極多。
不說必須的人才和工程師隊(duì)伍,單說資金成本,有機(jī)構(gòu)今年2月估算,以ChatGPT今年1月的水平,需要3萬多塊英偉達(dá)A100卡( GPU),初始投入成本8億美元,每天電費(fèi)5萬美元。GPT3訓(xùn)練一次成本140萬美元,更大的模型每次訓(xùn)練成本在200萬美元到1200萬美元之間。
既然是基礎(chǔ)設(shè)施,它就有邊際成本遞減的特點(diǎn),基于一個(gè)底座模型開發(fā)的實(shí)際業(yè)務(wù)用途越多,越有利于攤薄龐大的訓(xùn)練成本,也越有利于底座模型能力的進(jìn)化迭代和生態(tài)繁榮。
因此,如果是在別人的底座模型上去提煉行業(yè)垂直模型和做開源微調(diào)模型,不僅關(guān)乎數(shù)據(jù)安全和自主可控的問題,而且是在給別人的生態(tài)添磚加瓦。
今天,英偉達(dá)GPU+CUDA開發(fā)工具+OpenAI的算法和大眾影響力+優(yōu)質(zhì)英語語料數(shù)據(jù)+全球優(yōu)秀開發(fā)者+成熟的資本市場的大模型生態(tài),無疑是一個(gè)強(qiáng)勢生態(tài)。
在這個(gè)基礎(chǔ)上,對潛在競爭者掐緊底層,開放上層,復(fù)刻wintel生態(tài)的一統(tǒng)江湖,是對方早已擺上棋盤的變化圖。但這對中國和廣大發(fā)展中國家意味著什么,不言而喻。
對此如何破局,是我們要講的第二個(gè)重點(diǎn)。
在發(fā)布會現(xiàn)場,科大訊飛攜手華為,發(fā)布基于昇騰生態(tài)的“飛星一號”大模型算力平臺,科大訊飛董事長劉慶峰、科大訊飛總裁吳曉如和華為輪值董事長徐直軍、華為公司董事質(zhì)量流程IT總裁陶景文、華為董事ICT產(chǎn)品與解決方案總裁楊超斌共同宣示,將致力于為世界“提供第二種選擇”。
剛才已經(jīng)講過,底座大模型(LLM)是AI行業(yè)應(yīng)用的基礎(chǔ)設(shè)施,算力平臺則是更底層的,訓(xùn)練底座大模型的基礎(chǔ)設(shè)施。要訓(xùn)練對標(biāo)GPT-4的大模型,就需要更高性能的底座,聰院(訊飛研究院院長劉聰)在采訪中給出了一個(gè)數(shù)字,“一兩千張卡不夠,需要3000-4000P的算力,也就是說萬卡級別?!?/p>
一方面,需要這么大的算力,另一方面,這種規(guī)模的算力不可能即插即用。算力平臺、算法和框架之間的協(xié)同和優(yōu)化極其重要。
合作分工上,科大訊飛更專注應(yīng)用和算法,華為負(fù)責(zé)算力平臺,雙方共同研發(fā)了高性能的算子庫,使同樣的算力、帶寬條件下,訓(xùn)練效率得以提升一倍以上。
所以,徐直軍這次是作為星火V3.0大模型的幕后團(tuán)隊(duì)代表亮相的。從5月6日開始,華為的團(tuán)隊(duì)就常駐合肥,跟訊飛團(tuán)隊(duì)一起熬夜加班,劉慶峰把雙方的攻關(guān)團(tuán)隊(duì)親切稱呼為“聯(lián)合特戰(zhàn)隊(duì)”。今年中秋節(jié),這支隊(duì)伍都沒有休息,訊飛把華為團(tuán)隊(duì)的家屬都接到合肥一起過節(jié)。
劉慶峰在采訪中說得很坦率,也很動(dòng)容。
他說,使用英偉達(dá)成熟的算力產(chǎn)品可能一個(gè)月就能干成的事情,用國產(chǎn)的可能要三個(gè)月。那邊市場上又在打仗,別人用的是最豪華的武器;我們一邊在打仗,一邊磨練武器,在這個(gè)過程中要投入的就更多,壓力可想而知。
但這一步非走不可。因?yàn)?,不管是國產(chǎn)操作系統(tǒng),國產(chǎn)算力平臺,還是大模型,都有一個(gè)從打磨、到可用、逐步到好用,再到整個(gè)生態(tài)繁榮的過程,早期一定會花費(fèi)更多成本,這是事物的客觀規(guī)律。如果誰都不肯往前走一步,國家始終就無法自立自強(qiáng)。
第三個(gè)重點(diǎn)是應(yīng)用和生態(tài)。
如何尋找和解決“剛需”,實(shí)現(xiàn)社會價(jià)值和商業(yè)邏輯,都在這一part。
劉聰有一個(gè)錘子和釘子的比喻,“當(dāng)你有一把錘子的時(shí)候,你看所有的東西都像是釘子”。這就是我們曾經(jīng)嘗試用AI技術(shù)的通用能力解決各種場景與問題。
但慢慢發(fā)現(xiàn),通用能力在實(shí)際應(yīng)用中往往難以適應(yīng)不同的場景需求,這就像發(fā)現(xiàn)每個(gè)釘子的形狀都不同。
于是衍生出兩個(gè)嘗試方向:一是繼續(xù)強(qiáng)化錘子的通用性,嘗試打造一把萬能的雷神的錘子;二是嘗試根據(jù)不同的釘子定制錘子,這伴隨了行業(yè)定制的復(fù)雜性、高成本等問題。
后來又發(fā)現(xiàn)第三條思路,就是把錘子的改造和應(yīng)用的探索開放給大家,來適應(yīng)更多樣的需求。
這恰好能對應(yīng)訊飛的“1+N+X”的戰(zhàn)略,其中,“1”是通用認(rèn)知智能大模型算法研發(fā)及高效訓(xùn)練底座平臺;“N”是應(yīng)用于教育、醫(yī)療、人機(jī)交互等各個(gè)領(lǐng)域的自有產(chǎn)品;“X”是開放生態(tài)。
分別展開一下,首先是萬能錘子,徐直軍在現(xiàn)場非常實(shí)誠地為訊飛打了一個(gè)廣告。他說,華為在全球所有智能終端上使用的語音技術(shù),都來自于科大訊飛,不僅是中文,是幾十種語言。
翻譯,恐怕是近年來人工智能發(fā)展最讓普通人擁有獲得感的方向之一。
這次訊飛展示的另一把“萬能錘子”:代碼能力,說到底也是一種翻譯能力。
因?yàn)椤白詈玫木幊陶Z言是自然語言”,今天,千行百業(yè)都說數(shù)字化轉(zhuǎn)型,數(shù)字化轉(zhuǎn)型離不開IT部門,但I(xiàn)T部門不是轉(zhuǎn)型主導(dǎo)者,IT的工作是把主導(dǎo)者的思路翻譯成軟件,如果這個(gè)翻譯過程能被機(jī)器取代,將節(jié)約大量的溝通和摩擦成本。
訊飛總裁吳曉如和代碼產(chǎn)品負(fù)責(zé)人張致江在代碼論壇現(xiàn)場演示了大模型如何從拆解和分析需求開始,一步步生成軟件產(chǎn)品,有興趣的朋友可以去看看錄播。
其次是定制錘子,現(xiàn)場既展示了訊飛多年深耕的教育、醫(yī)療、人機(jī)互動(dòng)等賽道的升級,也發(fā)布了科研、金融、工業(yè)等領(lǐng)域的12個(gè)行業(yè)大模型。
現(xiàn)場演示的醫(yī)療大模型和科研大模型令人印象深刻,值得一提的是,醫(yī)療大模型并非要取代醫(yī)生,而是致力于幫助億萬普通人觸達(dá)基本的醫(yī)療知識;科研大模型并非取代科研工作,而是幫助人提升獲得知識和前沿信息的效率。
這里順便回應(yīng)一下關(guān)于人工智能會帶來失業(yè)、毀滅人類等常見大眾焦慮:
我們認(rèn)為,這種焦慮并非來自人工智能本身,而是來自于這個(gè)強(qiáng)大變量被注入后,有的人擔(dān)心既有格局被沖擊,有的人擔(dān)心既有格局被加強(qiáng)。人工智能究竟被用于更好地控制大眾,還是更好地賦能和服務(wù)大眾,恐怕這也是徐直軍說的“第二種選擇”的題中之義。
再來講講大家一起玩錘子,也就是生態(tài)建設(shè)。當(dāng)下,發(fā)現(xiàn)錘子的用途和改造方式急需千行百業(yè)的“腦洞”和“奇思妙想”,也需要各種各樣輕巧創(chuàng)新的工具和小部件。
比如大模型知名工具LangChain,將提示詞(Prompt)的管理和編排做得很好;ELMo工具具有根據(jù)上下文動(dòng)態(tài)調(diào)整詞向量的能力,使得對話系統(tǒng)的表現(xiàn)更加流暢。
LangChain頁面
劉聰在采訪中透露了一組星火大模型生態(tài)開發(fā)者的數(shù)據(jù):從5月6日至今,生態(tài)開發(fā)者數(shù)量從400萬迅速上升到530多萬,增速是去年同期的三倍多。他估計(jì),其中已經(jīng)跟訊飛鏈接,比較認(rèn)真在做大模型相關(guān)研發(fā)的開發(fā)者數(shù)量已達(dá)10萬左右。這個(gè)規(guī)模是比較狹義的星火生態(tài)。
更廣義的生態(tài),不但包括整個(gè)“1+N+X”的體系,還包括作為支撐的整個(gè)社會外部環(huán)境,從邏輯上來說,1是N和X的基礎(chǔ),有了足夠扎實(shí)的1,才能有N和X的衍生,N和X繁榮帶來的數(shù)據(jù)、人才、資金等資源會反哺1,形成正向循環(huán),也會出現(xiàn)強(qiáng)者愈強(qiáng)的先發(fā)優(yōu)勢和馬太效應(yīng)。
今天我們看到,OpenAI的GPT-4大模型是世界領(lǐng)先的,不管是劉慶峰還是劉聰,都坦誠面對這個(gè)事實(shí)。但是,當(dāng)前中美兩大市場因?yàn)榉N種原因處于割裂狀態(tài),大大削弱了這種先發(fā)優(yōu)勢,中國市場足夠大,足以支撐起一套自有生態(tài)的起步和起旋。這是站在中國視角來說。
站在人類命運(yùn)共同體視角來說,大教堂和集市要結(jié)合,絕對的集中和絕對的自由都不可取。對所有用戶和消費(fèi)者而言,存在兩種以上AI生態(tài)的多極化競爭,才可能在更高層次上形成共贏博弈,這是我們理解的“為世界提供第二種選擇”的另一層意義。
02. 升華
在當(dāng)前的熱鬧喧囂中,我們還想談一點(diǎn)歷史。
就像我們在開頭說的,人工智能并非始于當(dāng)下,而是一場從上世紀(jì)50年代就開始的馬拉松,它是一個(gè)螺旋式前進(jìn)的過程,已經(jīng)經(jīng)歷了三波浪潮和兩次低谷。日本的五代機(jī)路線失敗了,今天聚光燈下神經(jīng)網(wǎng)絡(luò)路線和OpenAI,也長期經(jīng)受打壓和質(zhì)疑。
在這個(gè)過程中,大量資源投入可能是必要條件,但越用力,在方向上的把握就越重要,就如劉聰所說,“對算法沒把握的話,錯(cuò)一個(gè)東西,三個(gè)月就過去了。”更宏觀的層面上,也是這樣。
中國人工智能研究始于上世紀(jì)70年代末的第二波浪潮,當(dāng)時(shí)不僅在符號主義的研究上取得了世界級的成果,也趕上了神經(jīng)網(wǎng)絡(luò)研究的浪潮。更重要的是,在大方向上始終保持大致正確,尤其在上世紀(jì)90年代全球人工智能研究進(jìn)入低谷的時(shí)候,國家主導(dǎo)的863(-306)計(jì)劃孕育了一大批人才,也孵化了科大訊飛、漢王、寒武紀(jì)、中科信利等一大批領(lǐng)軍企業(yè),使我們追趕到今天的位置。
對于中國發(fā)展人工智能的長處和短處,鵬城實(shí)驗(yàn)室主任、中國工程院高文院士有一個(gè)高度概括的論述。
總體來講,我國發(fā)展人工智能有優(yōu)勢也有短板,優(yōu)勢有四個(gè):強(qiáng)有力的政策支持、龐大的數(shù)據(jù)、豐富的應(yīng)用場景、非常多的有潛力的年輕人。同時(shí)有四個(gè)短板:基礎(chǔ)理論和原創(chuàng)算法薄弱、關(guān)器核心元器件薄弱、開源開放平臺建立不足、高端人才不足。
實(shí)際上,科技部在新一代人工智能發(fā)展規(guī)劃方面已經(jīng)有了一個(gè)很好的前瞻性考慮,基本原則有四個(gè):一是科技引領(lǐng),二是系統(tǒng)布局,三是市場主導(dǎo),四是開源開放。目標(biāo)是在 2020年中國的人工智能能夠和世界同步,到2025年其中一部分能夠達(dá)到領(lǐng)先水平,到2030年總體上能夠走在前面。
今天我們說了那么多,也是希望彌合一點(diǎn)信息差,讓更多人認(rèn)識到這件關(guān)乎所有人命運(yùn)的事情,減少誤解,凝聚共識,使更多的關(guān)注和資源配置到正確的方向上。我們一定能夠以星星之火,成就燎原之勢,引領(lǐng)新一輪通用人工智能帶來的變革。?