近年來,生成式人工智能的發(fā)展如火如荼,從通用大模型、行業(yè)大模型,到智能體、智能機器人。大模型和智能體的方式都有研發(fā)和應用之意,前者研發(fā)的理論性多些,后者更傾向應用研發(fā),都力圖盡快進入應用。但發(fā)展過程難免存在認知和操作上的一些矛盾。將AI研發(fā)與應用統(tǒng)一起來,旨在提升人工智能水平、促進人工智能產(chǎn)業(yè)發(fā)展。
01、生成式AI在研發(fā)與應用過程的矛盾
??AI發(fā)展無疑會帶來巨大潛力和廣闊的應用前景。對AI大模型、行業(yè)模型、智能體、機器人的研發(fā),是科學、技術,還是工程,有不同的說法,也引發(fā)研發(fā)和應用上的若干分歧。
大模型研發(fā)擴張與應用減緩的矛盾
大模型的出現(xiàn)顛覆了人們的認知,在驚嘆其大突破的同時,不少公司將大模型研發(fā)作為投資熱點,搶占制高點,但起初對大模型規(guī)律并不清晰,研發(fā)中面對龐大的算力、規(guī)模數(shù)據(jù)和算法的要求,200多家公司從事大模型研發(fā)有可能造成重復建設、資源浪費。雖然通用大模型在營銷、辦公、客服、人力資源、基礎作業(yè)等領域也開始一些應用,但對AI已有成果的應用有所減緩。而且通用大模型更適合to-c,面向產(chǎn)業(yè)轉(zhuǎn)化較少,而投資、科技、企業(yè)、社會、媒體都將眼光盯在模型的功效上。以至有人呼吁不要卷模型,要卷應用。沒有應用,大模型將一文不值。事實上,也不能讓人們的注意力長期停留在對大模型的爭論和焦慮中,要讓搞科技的人關注AI深入研發(fā),讓更多企業(yè)集中在AI已有成果的應用,在發(fā)揮各自作用中推進人工智能的探索和發(fā)展。
通用大模型與行業(yè)大模型的差異
AI大模型研發(fā)從全面探索轉(zhuǎn)向規(guī)模試點和特定領域的智能生成,需要根據(jù)不同領域的需求定制AI解決方案。通用大模型、行業(yè)大模型,都是生成式AI的嶄新探索,前者傾向廣泛領域和理論研發(fā),后者多是特定領域的應用研發(fā)。由于研發(fā)通用大模型數(shù)據(jù)需求量大,算力損耗多,很難較快地應用落地,于是不少公司轉(zhuǎn)向行業(yè)、產(chǎn)業(yè)和企業(yè)的垂直模型研發(fā),這是探索和實踐中的選擇。圍繞大模型的深入研發(fā)和已有成果的盡快應用,在爭論中逐漸形成兩種較為明顯的態(tài)度:一種是追求技術,主張走通用大模型之路,提高“更大更強的AI能力”;一種是將AI成果盡快用到市場,要多發(fā)展行業(yè)模型,走產(chǎn)業(yè)之路,認為將“足夠的AI能力”投入快速變現(xiàn)到商業(yè)場景,用市場龐大而獨特的數(shù)據(jù)構(gòu)筑壁壘。兩者都有道理,但易走極端,應該倡導兩者相互理解吸收,把力量集中在符合我國實際的研發(fā)和應用上,推進“人工智能+”的落地和發(fā)展。
開源模式與閉源模式的張力
大模型的開源和閉源是研發(fā)企業(yè)選擇的不同模式。開源是開放源代碼,允許任何人獲得并修改軟件的源代碼,通過更大范圍的開發(fā)者、研究者和愛好者的合作,拓寬技術創(chuàng)新邊界,為人工智能發(fā)展注入活力。閉源是將軟件源代碼僅由軟件編寫者或系統(tǒng)開發(fā)商掌握,通過核心技術和商業(yè)模式的保護,使企業(yè)從技術成果中獲得經(jīng)濟回報,在涉及敏感信息和高安全要求領域,閉源形式尤為重要?。兩種模式反映技術進步與社會價值、經(jīng)濟效益與安全保障之間的平衡探索。開源和閉源之爭實際是對這種平衡的不同選擇和追求。選擇開源的企業(yè)希望通過全球合作推動技術創(chuàng)新和應用發(fā)展;選擇閉源的企業(yè)以保護其技術和商業(yè)利益為主。例如,Open AI 發(fā)布的o1模型,在交互過程中默認隱藏了思維鏈,也可能不想讓其他開發(fā)者和用戶看到模型思考過程。開源和閉源彼此的張力,體現(xiàn)在商業(yè)模式和技術選擇上,反映不同企業(yè)對未來發(fā)展的戰(zhàn)略考慮。黑石集團董事長蘇世民認為,企業(yè)更有利于研發(fā)大模型,從數(shù)據(jù)積累、算力投入、研發(fā)本身的技術和工程性質(zhì),似乎企業(yè)比大學研發(fā)更有優(yōu)勢,更易突破[5]。而且通用大模型研發(fā)還可給行業(yè)模型、智能體以及各行各業(yè)賦能,應用中各行業(yè)豐富的場景、海量的數(shù)據(jù)、優(yōu)勢的資源投入,又在強化通用大模型研發(fā),使科技研發(fā)和應用相輔相成,達到統(tǒng)一。
02、如何將AI研發(fā)與應用統(tǒng)一起來
AI的研發(fā)和應用是邏輯發(fā)展的統(tǒng)一,出現(xiàn)上述現(xiàn)象有著特殊背景和原因,需在深入發(fā)展中化解。
發(fā)展鏈路將研發(fā)與應用統(tǒng)一起來
大模型出現(xiàn)以來,生成式人工智能逐漸形成“大模型—行業(yè)模型—智能體—機器人”的發(fā)展鏈路。各環(huán)節(jié)都有相對獨立性,按照技術邏輯,它們排列有序地發(fā)展。
一要重點發(fā)展幾家通用大模型,提高我國AI技術競爭力。對通用大模型尚無統(tǒng)一的定義,多數(shù)人理解的大模型,包括大語言模型和多模態(tài)大模型。通用大模型在技術和理論上展現(xiàn)出強大能力,可為各個領域賦能并帶來機遇,是重塑人類社會的重要因素。通用大模型不僅需要的參數(shù)規(guī)模大,算力規(guī)模大,而且在遇到數(shù)據(jù)瓶頸、算力瓶頸的情況下,走到無盡的前沿,不知道還要多長時間、還需多大投入,才能有新的突破。月之暗面的CEO楊植麟認為解,Open AI o1模型就是在天然數(shù)據(jù)不夠用時,用較好的基礎模型強化學習,創(chuàng)造出很多非天然數(shù)據(jù),提高了數(shù)據(jù)質(zhì)量和計算效率,進而產(chǎn)生出更深入的思考和推理,實際上他們創(chuàng)新出一種新的范式。深入研發(fā)通用大模型,需要不斷挑戰(zhàn),奔向通用人工智能的目標。因此,搞大模型研發(fā)的企業(yè)不必過多。由于美國對我采取AI技術限制,我國必須要有一些具備世界競爭力的通用大模型。人工智能專家吳軍認為,“現(xiàn)在全世界大模型成規(guī)模的沒幾家,美國大概5-10家,歐洲基本上就法國一家,若每個國家建一個大模型不可能,這很燒錢,我國應重點扶植不超過10家?!蹦壳?,我國的baichuan3、智譜glm-4、騰訊混元、通義千問2.1、文心一言4.0、華為盤古、月之暗面的Kimi、抖音的豆包、阿里通義千問Qwen2、可靈AI等大模型走在前列,除上述大模型做得好的公司,我國互聯(lián)網(wǎng)大廠、相關大型企業(yè)擁有規(guī)模數(shù)據(jù),有實力解決算力問題,也符合大模型研發(fā)的條件。大模型具備通識和泛化能力,由于應用中存在數(shù)據(jù)隱私和算法偏見、數(shù)學和邏輯推理能力不足等問題,通用大模型很難滿足具體行業(yè)的特定需求、專業(yè)性能和經(jīng)濟效率,缺少細分度更高的產(chǎn)品,在公有云提供服務中會造成企業(yè)私有數(shù)據(jù)、敏感數(shù)據(jù)安全性的擔憂,使用中還需通過傳統(tǒng)的磨合流程來實現(xiàn)產(chǎn)品與市場的契合,將通用大模型融入核心業(yè)務流程的案例不多,而行業(yè)大模型更有利于發(fā)展專業(yè)能力和精準賦能。但也有專家認為,現(xiàn)在的產(chǎn)品很大程度由模型能力決定,要把產(chǎn)品和模型更緊密地結(jié)合起來去思考。比如產(chǎn)品上想做一個功能,背后需要對應模型能力的支撐。還有互聯(lián)網(wǎng)大廠的企業(yè)家強調(diào)大模型賦能智能體,其實踐意義更大,應用前景廣闊。
二要大力發(fā)展行業(yè)模型和業(yè)務模型,發(fā)揮我國產(chǎn)業(yè)齊全和技術應用的優(yōu)勢。行業(yè)模型“利用通用大模型技術,針對特定數(shù)據(jù)和任務進行訓練或優(yōu)化,形成具備專用知識與能力的模型及應用。國際上更多用垂直模型來表示,我國還有垂類模型、領域模型、專屬模型等稱謂?!?行業(yè)模型本質(zhì)上是解決方案。從用戶在乎產(chǎn)品而非技術的實際出發(fā),盡快把技術轉(zhuǎn)化成產(chǎn)品,才有利解決問題。行業(yè)大模型提供的不僅是產(chǎn)品和工具,還有定制服務與支持,需要客戶參與共建。一方面,企業(yè)為提升競爭力和智能化轉(zhuǎn)型,滿足市場需求,想將數(shù)據(jù)轉(zhuǎn)化為核心驅(qū)動,主動尋找最佳模型;另一方面,AI技術公司也在選擇對人工智能提升發(fā)展質(zhì)量有需求的特定行業(yè)、企業(yè)、產(chǎn)業(yè)開展合作。研發(fā)方和需求方結(jié)合,共同深耕 “人工智能+行業(yè)產(chǎn)業(yè)企業(yè)”,利用行業(yè)專業(yè)數(shù)據(jù)或私有數(shù)據(jù)、特色應用場景等獨特資源,對模型定制調(diào)整和優(yōu)化,會較快地進入應用,針對性地解決問題,產(chǎn)生價值。行業(yè)模型和智能體是相互關聯(lián)和互補的技術,共同推動AI技術的產(chǎn)業(yè)化。
三要把智能體和機器人作為智能發(fā)展的重點,培植和壯大智能產(chǎn)業(yè)。智能體是具有智能的實體。以云為基礎,以AI為核心,構(gòu)建一個立體感知、全域協(xié)同、精準判斷、持續(xù)進化、開放的智能系統(tǒng)。智能體包括智能行為的物理實體和虛擬存在,比如物理形態(tài)的機器人和虛擬形態(tài)的數(shù)字人。智能體遠超近年國內(nèi)使用的Siri、小愛同學、天貓精靈等智能助手。智能體可以幫助我們處理更加復雜的任務。在大模型技術加持下,智能體將具有自主性、感知性和行動能力,在復雜環(huán)境中自主決策、學習進化,更接近人類智能本質(zhì)。隨著新型芯片技術的涌現(xiàn),將會出現(xiàn)無人汽車、無人機、機器人等顛覆性的智能體,將實現(xiàn)更高層次的智能化。這種應用驅(qū)動的AI研發(fā),目的使智能體成為人類廣泛使用的商品,并根據(jù)使用環(huán)境和用處,按需求定制形狀、大小及功能不同的智能體。機器人是智能體中重要的一種,跟傳統(tǒng)機器人相比,具身智能機器人有泛化性優(yōu)勢。傳統(tǒng)工業(yè)機器人可解決固定搬運、固定點位的焊接、噴涂等相對固定的方式的問題,但在工序復雜的總裝過程,工業(yè)機器人還不如人工安裝。大模型賦能的智能機器人就可應對此類問題。工業(yè)用智能機器人會快于家用機器人落地應用,約在3到7年可批量生產(chǎn)。家用機器人因任務復雜程度高,任務完成的滿意程度不同,需要5到10年才可量產(chǎn)。上述智能方式都需技術研發(fā),都有很高應用價值,共同構(gòu)成人工智能發(fā)展格局。研發(fā)為應用打基礎,應用是研發(fā)的目的,宏觀上體現(xiàn)了研發(fā)與應用的統(tǒng)一。?
揚長避短將AI研發(fā)和應用統(tǒng)一起來
AI發(fā)展有研發(fā)、應用等環(huán)節(jié),但并非每個企業(yè)都要按順序?qū)⒏鳝h(huán)節(jié)做一遍。在全球化、數(shù)智化、市場化條件下,要揚長避短才能在AI的發(fā)展中相互成就和發(fā)展。目前,在人工智能各環(huán)節(jié),美國處于研發(fā)領先地位并帶動著應用。美國去工業(yè)化后,其產(chǎn)業(yè)結(jié)構(gòu)以金融和服務業(yè)為主,通用大模型的應用,主要覆蓋金融、財務、審計、研發(fā)、法律、醫(yī)療等領域。我國產(chǎn)業(yè)齊全、制造業(yè)發(fā)達,更適合AI快速應用于產(chǎn)業(yè)、行業(yè)和社會。加之我國具有互聯(lián)網(wǎng)應用、數(shù)字技術應用的經(jīng)驗,在通用大模型研發(fā)帶動下,已在金融、服務、文教、醫(yī)療、創(chuàng)作等通用模型易應用的領域廣泛落地。現(xiàn)在除加大幾家通用大模型研發(fā)力度外,要發(fā)揮我國技術應用優(yōu)勢,重點加強AI行業(yè)大模型、業(yè)務模型、智能體、機器人等不同方式的應用研究。使少數(shù)骨干公司的大模型研發(fā)成為賦能各項AI應用的“蓄水池”,使AI各種方式的應用直接服務于具體產(chǎn)業(yè),使它們既承接通用大模型的技術賦能,又能結(jié)合行業(yè)、企業(yè)和社會應用的場景和需要,向著智能產(chǎn)業(yè)、智能應用的方向發(fā)展,并將豐富的應用場景等資源和問題反哺大模型、行業(yè)模型的研發(fā),形成通用大模型與AI應用“相輔相成、相互促進”的良性循環(huán)。
運用靈活方式將研發(fā)與應用統(tǒng)一起來
2023年中期,我國200多家公司相對集中在通用大模型的研發(fā)上,在全球研發(fā)大模型的數(shù)量最多。隨著AI技術邏輯的演進,不斷深化對大模型的認識,無論從能力、需求、成本、市場等方面看,不需要更多公司都擠在大模型研發(fā)的獨木橋。當初一些研發(fā)大模型的公司,轉(zhuǎn)變到AI應用研究或AI應用的方向。一種方式是,原先做大模型的公司改做行業(yè)大模型,它們積累了扎實的知識基礎和豐富的交互體驗,知道如何承接大模型的技術賦能,從而做好行業(yè)模型。另一種方式是,基于一些通用大模型的開源模式,開展行業(yè)大模型研發(fā),能對模型結(jié)構(gòu)、參數(shù)等按需調(diào)整,更好地適配個性化應用需要。“市場上諸多金融、法律、教育、傳媒、文旅等行業(yè)模型,大多是在Llama、SD、GLM、Baichuan等國內(nèi)外主流開源大模型基礎上構(gòu)建的?!眱煞N方式都不用過大的算力和數(shù)據(jù),省去很多訓練時間和成本,又能放心地利用私有數(shù)據(jù)提升應用效果,減少數(shù)據(jù)安全疑慮,很好地將AI技術研發(fā)轉(zhuǎn)化到應用研究上來。還有一種方式,就是開發(fā)比行業(yè)模型更靈活的領域模型或業(yè)務模型,它適合國內(nèi)市場極度豐富的業(yè)務場景,能促成生成式人工智能商業(yè)化。領域模型更適合超大規(guī)模的AI應用市場和多種服務模式。中國信息通信研究院公布的數(shù)據(jù)顯示,2023年我國人工智能產(chǎn)業(yè)應用進程持續(xù)推進,核心產(chǎn)業(yè)規(guī)模達到5784億元。不少屬于行業(yè)大模型和領域模型以及AI工具的應用。有家公司2023年做AI視頻面試,比上年翻了一倍以上。現(xiàn)在校招面試成本很貴,他們用AI視頻取代微信私域營銷,面試打分客觀,還會追問應試者,場景很多,達到降本增效的目的。義烏一個女老板應用前沿的AI視頻,化身語言達人,熟練切換多國外語,介紹自家生意,打造了全新的應用場景。諸如此類的AI研發(fā)和應用,都值得推廣。
03、提升人工智能發(fā)展質(zhì)量和價值的建議
我國人工智能的研發(fā)勢頭正旺,智能產(chǎn)業(yè)前景樂觀,AI應用將會蓬勃發(fā)展。從目前的探索和實踐看,尚需夯實AI的基礎建設,致力于技術創(chuàng)新,拓寬商用渠道,統(tǒng)籌處理AI的研發(fā)、產(chǎn)業(yè)化和應用的關系。
營造良好的政策和服務環(huán)境
我國已就AI的標準、能力、倫理、創(chuàng)新、治理等方面,出臺了相關政策和法律,以確保技術發(fā)展符合社會的價值觀和倫理標準,形成擁抱AI發(fā)展的社會環(huán)境,政府部門、行業(yè)協(xié)會和市場監(jiān)管方面,對剛起步的生成式AI的研發(fā)和應用,應多包容,多服務,逐漸引導規(guī)范,使其走上健康的智能發(fā)展路子。
AI技術產(chǎn)業(yè)化要為產(chǎn)業(yè)的智能化開路
網(wǎng)絡運營商、軟硬件設備終端提供商、互聯(lián)網(wǎng)企業(yè),是大模型應用的先行者。它們數(shù)字化程度高、數(shù)據(jù)積累豐富、技術接受能力強,會成為大模型落地較早的行業(yè)。這些行業(yè)的大模型應用場景廣泛,覆蓋了營銷、客服、內(nèi)容生成等諸多環(huán)節(jié),目前已有豐富和成熟的經(jīng)驗,它們的帶動示范和提供的大模型服務、工具、產(chǎn)品,正在傳導到制造等產(chǎn)業(yè),促進企業(yè)從數(shù)字化向智能化轉(zhuǎn)型升級。隨著各種智能方式和載體逐漸成熟落地,企業(yè)會在改造、提升傳統(tǒng)產(chǎn)業(yè)的同時,向著產(chǎn)業(yè)智能化快速發(fā)展。
打造堅實的AI技術底座
加大算力中心建設力度,促進算力統(tǒng)籌協(xié)同,隨著國產(chǎn)算力性能和易用性的提升,將會獲得AI公司和應用企業(yè)的青睞;要有效地積聚高質(zhì)量的數(shù)據(jù),擴大數(shù)據(jù)交易,發(fā)揮數(shù)據(jù)的資源和要素作用;以創(chuàng)新精神研發(fā)智能產(chǎn)業(yè)的不同載體,避免同質(zhì)化,體現(xiàn)技術、產(chǎn)業(yè)和應用的特點和優(yōu)勢,創(chuàng)造與眾不同的產(chǎn)品和服務,提升價值,積極推廣。
*本文刊載于《通信世界》總第956期 2024年11月25日 第22期
作者:中國國際經(jīng)濟技術合作促進會副理事長?邵春堡
責編/版式:蓋貝貝
審校:王 濤?梅雅鑫