你認識AI開發(fā)者嗎?
在工作中,我們會采訪形形色色的AI開發(fā)者。他們來自不同的地方,說著不同的口音。年紀小的還沒上小學(xué),年紀大的在退休之后又找到了新的興趣與夢想。他們有人心懷溫暖,用AI技術(shù)幫助聽障人士恢復(fù)聽力;有人心系桑梓,用AI能力防沙固沙,誓要把家鄉(xiāng)的沙漠變成綠洲;有人能力卓群,一個人就是一間AI工廠,完成的AI創(chuàng)新不計其數(shù)。
如果問,這些不同行業(yè),不同學(xué)科,不同年齡的AI開發(fā)者們有什么共同之處?我能想到的似乎有兩點。
一個是他們的眼里都有光亮,愿意用創(chuàng)新的思維去看待這個世界,嘗試用想象力去發(fā)現(xiàn)和解決問題。
另一個是他們的手里都有共同的工具——文心加飛槳,已經(jīng)成為無數(shù)AI開發(fā)者探索夢想的基石。
對于這些開發(fā)者來說,每年有兩次盛大的“節(jié)日”。那就是WAVE SUMMIT深度學(xué)習(xí)開發(fā)者大會。WAVE SUMMIT見證著飛槳和文心的成長,同時也陪伴了無數(shù)AI開發(fā)者的追夢之旅。
每年兩屆的WAVE SUMMIT,恰好在剛剛迎來了五年十屆的節(jié)點,也到了值得回顧、總結(jié)和再出發(fā)的時候。12月28日,百度首席技術(shù)官、深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程研究中心主任王海峰在第十屆WAVE SUMMIT深度學(xué)習(xí)開發(fā)者大會上發(fā)表了《文心加飛槳,翩然赴星河》主題演講。期間,王海峰分享了飛槳和文心的最新發(fā)展成果,公布了文心一言用戶規(guī)模已經(jīng)超過一億,同時也回顧了WAVE SUMMIT一路走來的思考與感受。
五年走來,一場花開。深度學(xué)習(xí)技術(shù)在中國大地上從嫩芽變成了雨林,AI開發(fā)者手中有了堅實的技術(shù)工具,面向千行百業(yè)的AI生態(tài)已經(jīng)成型,通用人工智能的曙光已經(jīng)顯現(xiàn)。
五年時間,正好適合回顧這一切的改變是如何發(fā)生的。面向未來,文心加飛槳的組合又將帶來什么?
百度與萬千AI開發(fā)者,將繼續(xù)赴這場AI技術(shù)的星河之約。
五年十屆:共赴AI的星辰大海
過去五年,是中國深度學(xué)習(xí)技術(shù)發(fā)展速度最快,AI開發(fā)者規(guī)模增長最快的時期。五年當中,無數(shù)開發(fā)者加入AI的尋夢之旅,萬千企業(yè)開啟了智能化的征程,大量院校與科研機構(gòu)開始用AI探索科學(xué)的奧秘。
回顧深度學(xué)習(xí)技術(shù)在中國的發(fā)展脈絡(luò),會發(fā)現(xiàn)WAVE SUMMIT是貫穿過去五年一條非常重要的發(fā)展線索。在這個舞臺上,每次都能分享到最具深度與前瞻性的AI技術(shù)洞察,每次都能迎來巨量的深度學(xué)習(xí)開發(fā)平臺與AI大模型技術(shù)更新。
WAVE SUMMIT走過了五年十屆。在這五年時間里,我們對AI技術(shù)的認識與洞察逐步加深,年年迭代。產(chǎn)學(xué)各界的共識不斷凝聚,面向未來的發(fā)展路徑不斷清晰。
在2019年的首屆WAVE SUMMIT,王海峰提出“深度學(xué)習(xí)框架是智能時代的操作系統(tǒng)”,“深度學(xué)習(xí)推動人工智能進入工業(yè)大生產(chǎn)階段”。這樣的判斷為智能化帶來了新的視野,“AI工業(yè)大生產(chǎn)”也成為接下來AI技術(shù)發(fā)展的核心。
接下來,王海峰在2020年提出了“打造AI新型基礎(chǔ)設(shè)施,云智一體加速產(chǎn)業(yè)智能化”,AI大生產(chǎn)平臺升級為云智一體的新型基礎(chǔ)設(shè)施,為產(chǎn)業(yè)智能化奠定了堅實基礎(chǔ);2021年,提出AI技術(shù)呈現(xiàn)“融合創(chuàng)新”和“降低門檻”的特點;2022年,確定了“深度學(xué)習(xí)平臺加大模型,貫通AI全產(chǎn)業(yè)鏈,夯實產(chǎn)業(yè)智能化基座”。時間來到2023年,王海峰明確提出了“大語言模型為通用人工智能帶來曙光”。
這些洞察和預(yù)判逐步推進,層層銜接,在不斷獲得產(chǎn)學(xué)各界認證的同時,推動接下來AI技術(shù)的持續(xù)發(fā)展。更重要的是,這些預(yù)判一次次點亮了AI開發(fā)者眼中的星光。
而文心加飛槳的體系建設(shè),則讓AI開發(fā)者可以將星光帶入現(xiàn)實。WAVE SUMMIT的另一重價值,在于將百度對AI技術(shù)的預(yù)判,轉(zhuǎn)化為真實的技術(shù)突破、工具升級、生態(tài)建設(shè),組成了蔚為大觀的深度學(xué)習(xí)基礎(chǔ)設(shè)施。其中,文心與飛槳已經(jīng)成長為整個AI產(chǎn)業(yè)的兩大支柱。
目前階段,飛槳已經(jīng)完成了包括核心框架、基礎(chǔ)模型庫、開發(fā)套件、工具組件等能力的全面建設(shè),還有助力開發(fā)者成長的星河社區(qū)。飛槳具有動靜統(tǒng)一的深度學(xué)習(xí)框架、端到端自適應(yīng)大規(guī)模分布式訓(xùn)練、云邊端全場景高性能推理等核心領(lǐng)先技術(shù)。
在飛槳生態(tài)方面,2019年飛槳開發(fā)者規(guī)模為150萬。截至2023年12月底,飛槳已凝聚1070萬開發(fā)者,服務(wù)23.5萬家企事業(yè)單位,基于飛槳創(chuàng)建了86萬個模型。突破千萬的開發(fā)者,證明了AI技術(shù)迎來了發(fā)展最快,凝聚力最強的時代。
在備受關(guān)注的大模型領(lǐng)域,百度在2019年開始預(yù)訓(xùn)練大模型研發(fā),推出了文心大模型1.0。經(jīng)過多年積累,今年3月百度率先發(fā)布了知識增強大語言模型文心一言。10月,文心一言的基礎(chǔ)模型升級到4.0,理解、生成、邏輯和記憶四大AI基礎(chǔ)能力全面提升。文心大模型4.0僅僅在過去兩個月整體效果又提升了32%。
王海峰現(xiàn)場披露,文心一言用戶規(guī)模已突破1億。自8月31日獲準開放對公眾提供服務(wù)以來,文心一言的用戶提問量一路攀升,獲得了越來越充沛的用戶信任。一億用戶的規(guī)模證明,下一個超級流量入口儼然已經(jīng)成型。
王海峰表示:“五載十屆,我們與所有開發(fā)者一起,踔厲奮發(fā),篤行不怠。愿繼續(xù)與所有開發(fā)者攜手并肩,在飛槳和文心的支持下,共赴通用人工智能的星辰大?!?。
WAVE SUMMIT走過的五年,似乎讓我們對AI技術(shù)一切認知都發(fā)生了變化。無數(shù)開發(fā)者、企業(yè)、科研工作者,以及來自千行百業(yè)的人們,共同走過了一段激動人心的AI旅程。
而更加讓人激動的旅途,永遠在未來,在更遠處。
花開大模型:文心生態(tài)進取突破
AI大模型,是2023年全球AI行業(yè),乃至整個科技行業(yè)的第一關(guān)鍵詞。AI開發(fā)者,以及更多有志于AI機遇的準開發(fā)者們,目前最關(guān)注的就是能否有效利用大模型技術(shù),能否加入一個完善的大模型生態(tài),能否將大模型與自身所在行業(yè)、領(lǐng)域進行結(jié)合?
回顧這一年,伴隨著文心一言的橫空出世,文心大模型頻頻帶給我們驚喜。在本屆WAVE SUMMIT當中,百度集團副總裁、深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程研究中心副主任吳甜發(fā)布了文心一言和飛槳星河社區(qū)的最新進展與升級動作。
從產(chǎn)業(yè)進程中看,文心大模型已經(jīng)取得了驚人的成績。從對外開放到今天,文心一言用戶已經(jīng)遍布全國各地,累計完成了37億字的文本創(chuàng)作,文本創(chuàng)作量相當于十部《永樂大典》、500套《魯迅全集》、10000本《三體》。在代碼生成方面,文心一言累計輸出了三億行代碼,涵蓋所有主流編程語言。
可以看到,不同領(lǐng)域,不同特點的用戶需求都在文心一言當中得到了極大地滿足。在學(xué)習(xí)方面,文心一言為中小學(xué)學(xué)生提供了一系列幫助,比如提升學(xué)習(xí)能力,進行口語訓(xùn)練,拓展課外知識。大學(xué)生則廣泛利用文心一言進行知識查詢,信息搜集,專業(yè)能力提升。
在專業(yè)應(yīng)用方面,文心一言已經(jīng)累計幫助用戶處理專業(yè)合同多達4億次,在租房合同審查等觸手可及的場景提供重要幫助。在旅行場景中,文心一言已經(jīng)累計制定了五百萬次的旅行計劃。
在悲歡交集的生活中,文心一言為用戶發(fā)出了1083萬次的關(guān)懷、鼓勵,提供了240萬次的建議和支持。當然,這些努力也得到了回饋,文心一言已經(jīng)收獲了超過2000萬次的贊賞和感謝。
過去一年里,文心一言的基礎(chǔ)模型文心大模型,發(fā)布了3.5和4.0兩個大版本。為了能夠帶給客戶更深層的幫助,文心大模型還研發(fā)了智能體技術(shù)。接下來,文心一言的智能體模式,將在專業(yè)版中開啟測試。
伴隨文心大模型的技術(shù)進步與產(chǎn)業(yè)發(fā)展,開發(fā)者對文心大模型的需求也愈發(fā)強烈。目前,星河社區(qū)已經(jīng)有超過4000個基于文心一言開發(fā)的應(yīng)用,覆蓋了各個行業(yè)與領(lǐng)域。面向未來,文心大模型的生態(tài)建設(shè)與開放,將成為最為重要的工作。
作為中國最大的AI開發(fā)者社區(qū),飛槳星河社區(qū)全面升級,為廣大開發(fā)者提供豐富的異構(gòu)算力和通用組件,飛槳產(chǎn)業(yè)級模型庫和全流程開發(fā)工具鏈,實現(xiàn)低成本開發(fā)AI應(yīng)用。在飛槳和文心大模型的共同驅(qū)動下,星河社區(qū)具備了“AI原生應(yīng)用創(chuàng)新全要素”,為開發(fā)者提供開發(fā)、體驗、推廣、交流、學(xué)習(xí)一體化服務(wù)。
最新發(fā)布的大模型工具中心,集合了百度人工智能多年來的建設(shè)成果,包括飛槳產(chǎn)業(yè)級模型庫、百度大腦AI能力、文心一言工具等,同時支持生態(tài)工具接入,賦能開發(fā)者高效開發(fā)AI原生應(yīng)用。
現(xiàn)場,吳甜使用大模型工具中心的“多工具智能編排”開發(fā)模式,演示了如何在零代碼情況下開發(fā)具備圖文識別、問答、翻譯、播報等多模態(tài)全功能的“旅行助手”應(yīng)用。
為了讓文心大模型更聰明,更智慧,WAVE SUMMIT上還首次公布了文心導(dǎo)師計劃。首批有10位來自不同領(lǐng)域的頂尖專家和學(xué)者將成為文心導(dǎo)師,他們的專業(yè)知識與深度思考,將讓文心一言在專業(yè)領(lǐng)域提升自身能力,強化專業(yè)造詣,為用戶提供更具有思想深度與廣度的支持。此外,文心大模型還與《辭?!飞疃群献?,將《辭海》龐大的數(shù)據(jù)融入文心基座大模型。
飛槳和文心大模型的生態(tài)之花,已經(jīng)綻開在AI時代的土壤中。融入這個生態(tài),建設(shè)這個生態(tài),將成為AI開發(fā)者打開未來之門的鑰匙。
根植開發(fā)者AI開發(fā)能力全面升級
開發(fā)者是文心加飛槳的根,需要把更好的開發(fā)體驗,更低的開發(fā)門檻,更充沛的開發(fā)工具交到開發(fā)者手中。面對這項工作,WAVE SUMMIT始終堅持將更好的開發(fā)能力、開發(fā)工具交付到開發(fā)者手中。根植開發(fā)者,幫助開發(fā)者,信賴開發(fā)者,是WAVE SUMMIT不變的底色。
在這一屆WAVE SUMMIT當中,百度AI技術(shù)生態(tài)總經(jīng)理馬艷軍發(fā)布了飛槳開源框架2.6版本和大模型重構(gòu)的開發(fā)工具鏈。
飛槳全新版本實現(xiàn)了開發(fā)體驗大幅提升。通過自適應(yīng)圖構(gòu)建機制,實現(xiàn)了動轉(zhuǎn)靜訓(xùn)練成功率達到100%,同時,實現(xiàn)了高擴展性IR,支撐大模型極致性能優(yōu)化;支持動靜統(tǒng)一自動并行編程,混合并行訓(xùn)練代碼開發(fā)大幅簡化。
在AI開發(fā)者最為關(guān)注的大模型開發(fā)層面,飛槳帶來了大模型套件全流程優(yōu)化。對大模型預(yù)訓(xùn)練、精調(diào),壓縮、推理、部署全流程關(guān)鍵技術(shù)進行了升級。同時,硬件適配方案升級,結(jié)合文心大模型的適配,更好地支持硬件廠商進行靈活定制、軟硬協(xié)同深度優(yōu)化。
在推動AI原生應(yīng)用開發(fā)方面,WAVE SUMMIT展示了大模型加持的開發(fā)工具鏈。其中,智能編碼伙伴Comate AutoWork,可以實現(xiàn)開發(fā)者輸入需求,AutoWork即可智能規(guī)劃完成從需求到編碼上線全流程,極大降低綜合開發(fā)成本。飛槳低代碼開發(fā)工具PaddleX在飛槳開發(fā)套件能力基礎(chǔ)上,充分結(jié)合文心大模型,實現(xiàn)了AI應(yīng)用開發(fā)效果和效率大幅提升。
除此之外,面向廣大開發(fā)者對大語言模型的開發(fā)需求,文心一言也推出了面向生態(tài)的開發(fā)機制。這次升級中,文心一言帶來了配套開發(fā)工具升級、優(yōu)化注入自動化流程、支撐開發(fā)者深度效果調(diào)優(yōu)、助力應(yīng)用推廣四大舉措,將典型應(yīng)用開發(fā)時間縮短40%以上,端到端效果提升30%以上。
至此,文心一言已經(jīng)提供了面向生態(tài)的一整套開發(fā)機制,開發(fā)者可以通過API和SDK使用文心大模型的基礎(chǔ)能力,并支持插件開發(fā)、多工具智能編排開發(fā),提供低代碼和零代碼開發(fā)界面,全面賦能開發(fā)者進行AI原生應(yīng)用開發(fā)。
結(jié)束語:翩然赴星河
在大模型生態(tài)不斷取得突破,AI開發(fā)能力不斷升級的加持下,AI可以成為每個人生活與工作中的工具,成為我們共同的機遇、能力與夢想。
為了讓更多人奔赴這場關(guān)于AI的星河之約,WAVE SUMMIT現(xiàn)場百度聯(lián)合啟動國內(nèi)首個《大模型產(chǎn)業(yè)人才標準與能力評價》,新一輪飛槳人工智能教育創(chuàng)新中心落成授牌。飛槳文心生態(tài)將為更多人打開AI大門,讓人人都可以成為AI開發(fā)者。
可以確定地說,五年來,AI開發(fā)者的一切都在改變。
他們掌握了核心技術(shù),可以用飛槳加文心去探索未知,解鎖更多生活與事業(yè)中的可能。
他們擁有了充沛的開發(fā)工具,AI開發(fā)的門檻不斷降低,助力不斷豐富,每個人都可以成為AI開發(fā)者的夢想在一步步變?yōu)楝F(xiàn)實。
他們建設(shè)了凝聚力極高的生態(tài),在飛槳與文心的生態(tài)體系中,開發(fā)者彼此幫助,與平臺形成良性互動,各個生態(tài)角色充分支持,AI生態(tài)變成了生機勃勃的雨林。
最重要的是,他們有了實現(xiàn)夢想的通道,并且相信文心加飛槳的通道會一直開啟,不斷迭代,奔涌向前。
五年來,WAVE SUMMIT從一個舞臺,一次交流,變成了一個節(jié)日,一種信賴,一場“翩然赴星河”。
“翩然赴星河”,是百度的邀請,是AI開發(fā)者的諾言,也是AI時代最為盛大的一場浪漫。