對AI創(chuàng)業(yè)者來說,最大的機(jī)會(huì)一度在互聯(lián)網(wǎng)、金融等領(lǐng)域。不過隨著ChatGPT這個(gè)龐然大物重重砸開新時(shí)代的大門,通往AGI(Artificial general intelligence;通用人工智能)的道路展現(xiàn)在眼前,有能力應(yīng)對各類情況、解決各種問題的“全才型AI”成為可期待的愿景,不論是科技巨頭還是創(chuàng)業(yè)者,都迅速錨定這個(gè)大市場。
日前,Meta首席執(zhí)行官馬克·扎克伯格首次明確宣布將投身AGI,并將對兩大研究團(tuán)隊(duì)FAIR和GenAI進(jìn)行更緊密的整合。OpenAI首席執(zhí)行官Sam Altman在達(dá)沃斯世界經(jīng)濟(jì)論壇上也表示,AGI即將在不久的將來到來,并且將改變世界,不過不會(huì)像人們想象的那樣劇烈。國內(nèi)方面也起波瀾,壁仞公司聯(lián)合創(chuàng)始人徐凌杰最近宣布離職,內(nèi)部告別郵件中寫道“AGI is calling,江湖再見”。
大模型拉動(dòng)AI產(chǎn)業(yè)發(fā)展,并向AGI生態(tài)閉環(huán)快速進(jìn)發(fā),也助推了AI創(chuàng)業(yè)的新方向。
無問蒼穹,清華師生組合再征AI大賽道
成立于2023年5月31日的上海無問芯穹智能科技有限公司,種子輪就引入了紅杉中國、北極光創(chuàng)投、金沙江創(chuàng)投等知名投資機(jī)構(gòu),以及無限基金SEE Fund等。去年11月30日,無問蒼穹悄然完成一輪天使輪融資,新增股東包括百度、騰訊、智譜AI等。
巨頭紛紛進(jìn)入,這家低調(diào)的創(chuàng)業(yè)公司引起了業(yè)界關(guān)注。
天眼查顯示,無問芯穹創(chuàng)始人汪玉,不論在學(xué)界還是產(chǎn)業(yè)界都頗有建樹,他擔(dān)任清華電子工程系長聘教授、系主任,信息科學(xué)技術(shù)學(xué)院副院長;而在AI火爆初期,汪玉擔(dān)任負(fù)責(zé)人的深度學(xué)習(xí)處理器項(xiàng)目,正是AI公司深鑒科技的雛形,汪玉的得意門生姚頌和單羿,是深鑒科技創(chuàng)始成員。無問芯穹種子輪的投資方無限基金SEE Fund,正是原“深鑒科技”創(chuàng)始人兼CEO姚頌所發(fā)起的。
深鑒科技自2016年成立以來,一直基于自適應(yīng)和智能計(jì)算企業(yè)賽靈思(已被AMD收購)的技術(shù)平臺(tái)開發(fā)機(jī)器學(xué)習(xí)解決方案。經(jīng)深鑒科技優(yōu)化的神經(jīng)網(wǎng)絡(luò)剪枝技術(shù)運(yùn)行在賽靈思FPGA器件上,可以實(shí)現(xiàn)突破性的性能和極佳的能效。2018年7月,賽靈思宣布完成對深鑒科技的收購。
再看無問芯穹法定代表人、執(zhí)行董事&總經(jīng)理曾書霖,他的導(dǎo)師正是汪玉。曾書霖2018年本科畢業(yè)于清華大學(xué)電子工程系,而后繼續(xù)攻讀博士學(xué)位,主要研究方向?yàn)檐?a class="article-link" target="_blank" href="/tag/%E7%A1%AC%E4%BB%B6/">硬件協(xié)同設(shè)計(jì)、深度學(xué)習(xí)加速器和FPGA(現(xiàn)場可編程門陣列)硬件虛擬化。曾書霖曾在賽靈思和深鑒科技也都有過實(shí)習(xí)經(jīng)驗(yàn),使他當(dāng)時(shí)對FPGA和AI、深度學(xué)習(xí)都有了更深入的體驗(yàn)。
根據(jù)官網(wǎng)介紹,無問芯穹提供AGI算力解決方案,以大模型能效優(yōu)化工具包為核心,整合國產(chǎn)芯片算力,構(gòu)建統(tǒng)一算力底座,提供包括NVIDIA、AMD、海光、天數(shù)智芯等多種加速算力云服務(wù),屏蔽硬件差異。
此外,無問芯穹向上通過智算云服務(wù)、智算一體機(jī)等多種方式服務(wù)大模型算法企業(yè),協(xié)同算力、算法、生態(tài)推動(dòng)行業(yè)大模型的高效落地,構(gòu)建AGI時(shí)代的大模型基礎(chǔ)設(shè)施。
如何看待AI大模型的發(fā)展挑戰(zhàn)?汪玉近期在業(yè)內(nèi)一個(gè)公開沙龍上提出了三點(diǎn):第一是芯片禁令和國產(chǎn)供應(yīng)鏈不成熟,導(dǎo)致高性能芯片和算力不足;第二是訓(xùn)練和推理居高不下的成本;第三,由于我國算法和芯片的生態(tài)分散,導(dǎo)致資源難以有效利用。
他指出,在模型層和芯片層之間,如何做高效的部署,通過統(tǒng)一的中間層解決異構(gòu)芯片的適配問題會(huì)是一條重要途徑。如果能夠通過相對統(tǒng)一的中間層,能夠支持長文本,做到更高的性價(jià)比、做到一鍵部署,并且包括一些工具可以輔助算法和應(yīng)用開發(fā)商,把算法壓縮、算子優(yōu)化包括自動(dòng)編譯等全都囊括在內(nèi)。那么這樣的一類中間層,是有望把M個(gè)大模型和N個(gè)硬件更好地匹配起來的。
“我們在努力做這樣一個(gè)中間層,在云端優(yōu)化不同的算力,以此來支撐更多不同的模型”,汪玉表示,“中國的大模型生態(tài),最后是需要應(yīng)用、模型、算法框架開發(fā)平臺(tái)和基礎(chǔ)設(shè)施聯(lián)合起來做的,怎么樣更好地推動(dòng)這樣一個(gè)生態(tài)的發(fā)展,是現(xiàn)在面臨的一個(gè)很重要的挑戰(zhàn)?!?/p>
智子引擎,人大師生布局AI大模型多模態(tài)理解
南京智子引擎信息科技有限公司成立于2021年5月。去年四五月份開始,大模型“戰(zhàn)況”逐漸升級,智子引擎正是在去年5月和8月分別宣布了天使輪和天使+融資進(jìn)展,總交易金額約為數(shù)千萬人民幣,披露的投資方有中金資本、軟通高科等。
智子引擎CEO高一釗,是中國人民大學(xué)高瓴人工智能學(xué)院博士生,師從盧志武。值得注意的是,盧志武在智子引擎擔(dān)任顧問一職,此外,他本人也是軟通動(dòng)力首席AI科學(xué)家。
公開資料顯示,盧志武團(tuán)隊(duì)是國內(nèi)最早研究多模態(tài)大模型、并取得杰出技術(shù)成果的團(tuán)隊(duì)之一。盧志武和高一釗從事多模態(tài)大模型始于 2020 年。
在 ChatGPT 的熱浪下,盧志武和高一釗看到了多模態(tài)研究在大模型時(shí)代的新機(jī)遇,成立了多模態(tài)大模型公司“智子引擎”。借鑒以往文瀾模型研發(fā)的經(jīng)驗(yàn),“智子引擎”團(tuán)隊(duì)于去年3月推出了自主研發(fā)的多模態(tài)對話大模型,并發(fā)布了第一款應(yīng)用級多模態(tài) ChatGPT 產(chǎn)品“元乘象 ChatImg”。
根據(jù)盧志武的介紹,ChatGPT的強(qiáng)項(xiàng)是在文本處理,對多模態(tài)方向的沖擊相較對少。“元乘象 ChatImg”發(fā)布的時(shí)間節(jié)點(diǎn)早于OpenAI的GPT-4,這也證明其團(tuán)隊(duì)對多模態(tài)大模型的前沿眼光。
“元乘象 ChatImg”就好比是“會(huì)看圖的ChatGPT”,它基于多模態(tài)融合模塊和語言解碼器,用戶輸入一張圖片,Chatlmg就能對其中的內(nèi)容進(jìn)行解讀,并繼續(xù)相關(guān)的對話。“元乘象 ChatImg”的參數(shù)量在百億級別,主要使用了圖文對數(shù)據(jù)和 VQA 數(shù)據(jù)作為訓(xùn)練集,同時(shí)進(jìn)行圖文匹配、圖文檢索、圖像描述生成、文本描述生成等多種任務(wù)的訓(xùn)練。根據(jù)用戶輸入的圖片或文字,“元乘象ChatImg”可以進(jìn)行智能聊天、講故事、寫廣告等。
高一釗認(rèn)為,2024年多模態(tài)領(lǐng)域會(huì)有較快增長,而這個(gè)領(lǐng)域又可以分成兩大方向,即多模態(tài)生成和多模態(tài)理解。
“多模態(tài)生成方向的視頻生成是目前最受大家關(guān)注的,資源也都流向了這里,2024年一定會(huì)產(chǎn)生非常多優(yōu)秀的成果。多模態(tài)理解方向是我們商業(yè)模式的核心,我們持續(xù)看好。這不僅是因?yàn)槲覀兛吹搅艘汛嬖诘男枨?,更因?yàn)槲磥?a class="article-link" target="_blank" href="/tag/%E6%97%A0%E4%BA%BA%E6%9C%BA/">無人機(jī)、機(jī)器人等領(lǐng)域都需要AI對多模態(tài)信息的理解能力。智子引擎2024年將會(huì)在多模態(tài)生成和理解方向發(fā)布多個(gè)模型及應(yīng)用,繼續(xù)做前沿的創(chuàng)新,推動(dòng)中國多模態(tài)行業(yè)的發(fā)展”,高一釗表示。
在元乘象Chatimg+無人機(jī)組合而成的智慧巡檢系統(tǒng)、元乘象Chatimg+智能機(jī)器人等應(yīng)用中,多模態(tài)大模型已經(jīng)初步展現(xiàn)出了下沉到一線應(yīng)用中的能力。相比以往AI在視覺層面的小試牛刀,多模態(tài)大模型可以賦予終端更多維度的信息交互能力,從而實(shí)現(xiàn)更為強(qiáng)大的感知和決策能力。
智慧互通獲云天勵(lì)飛Pre-IPO輪投資,發(fā)力AI交通大模型
成立于2015年6月的智慧互通科技股份有限公司,專注于計(jì)算機(jī)視覺與智能傳感、自動(dòng)化控制領(lǐng)域技術(shù)研發(fā)與應(yīng)用,提供超視線機(jī)器人(ASER)、車態(tài)感知(VSA)、全息道路(HRS)、智能路網(wǎng)(IRN)等技術(shù)和解決方案。
2018年至今,智慧互通已完成7輪融資,獲得小米集團(tuán)、高榕資本、蔚來資本、中金資本、綠動(dòng)資本、深創(chuàng)投、中關(guān)村啟航基金、中關(guān)村科學(xué)城等投資與助力。而在2023年12月28日宣布的最新一輪Pre-IPO中,智慧互通獲得了云天勵(lì)飛的Pre-IPO輪戰(zhàn)略投資。
據(jù)介紹,云天勵(lì)飛自主研發(fā)的國產(chǎn)AI芯片,可滿足智慧互通在城市路內(nèi)停車場景中高位視頻的邊緣計(jì)算需求,為智慧互通AI技術(shù)底座提供有力支撐。
云天勵(lì)飛去年發(fā)布的14nm Chiplet大模型推理芯片,采用國產(chǎn)工藝,內(nèi)含國產(chǎn)RISC-V核,支持大模型推理部署。依托其自研芯片DeepEdge10創(chuàng)新的 D2D chiplet架構(gòu)打造的X5000推理卡,已適配并可承載SAM CV大模型、Llama2等百億級大模型運(yùn)算,可廣泛應(yīng)用于AIoT邊緣視頻、移動(dòng)機(jī)器人等場景。
當(dāng)前,在AI的常見領(lǐng)域中,如機(jī)器視覺、人機(jī)交互、自然語言處理、知識(shí)圖譜、機(jī)器人等,國內(nèi)外的行業(yè)競爭都極為激烈,靠某項(xiàng)技術(shù)“一招鮮打天下”幾乎不再可能。因此,AI必須向傳統(tǒng)行業(yè)靠攏,尋找能解決問題、帶來價(jià)值的“AI+行業(yè)”交叉點(diǎn)。
在智慧交通基礎(chǔ)設(shè)施建設(shè)領(lǐng)域,我國政策紅利持續(xù)釋放,智慧城市基礎(chǔ)設(shè)施與智能網(wǎng)聯(lián)汽車協(xié)同發(fā)展的試點(diǎn)城市紛紛加快了智能路網(wǎng)建設(shè)的步伐。賽迪顧問測算數(shù)據(jù)顯示,2022年中國智能路網(wǎng)的市場規(guī)模為258.9億元,預(yù)計(jì)2030年能達(dá)到2634.8億元。
根據(jù)行業(yè)數(shù)據(jù),在智慧停車方面,當(dāng)前全國路邊停車泊位約200萬個(gè),高位視頻方案滲透率約30%且呈現(xiàn)快速上升趨勢。同時(shí), 根據(jù)國家統(tǒng)計(jì)局的汽車保有量3.19億輛和住建部車均泊位缺口0.3-0.5個(gè)測算,全國尚有8000萬以上的停車位需求缺口。路邊停車的邊緣計(jì)算算力需求將達(dá)十億以上市場量級。
盡管市場規(guī)模不斷擴(kuò)大,但具體應(yīng)用面臨著場景、芯片平臺(tái)、算力需求碎片化的痛點(diǎn),算法投入產(chǎn)出不成正比。大模型由于具有強(qiáng)大的圖像或語言理解能力、場景泛化能力,有望解決這些痛點(diǎn)。而為了滿足大模型部署需求,邊緣計(jì)算芯片需要考慮SoC集成、算力可靈活擴(kuò)展芯片架構(gòu)、統(tǒng)一的工具鏈架構(gòu)、隱私保護(hù)等方面因素。
據(jù)了解,雙方將打造更具市場競爭力的“AI+交通”解決方案,共同推動(dòng)國產(chǎn)AI芯片在智慧交通領(lǐng)域的應(yīng)用。
寫在最后
全球科技巨頭和初創(chuàng)企業(yè)共同角逐AI機(jī)遇,產(chǎn)業(yè)確定性不斷增強(qiáng)。特別是大語言模型、多模態(tài)技術(shù)的發(fā)展,以及所拉動(dòng)的AI創(chuàng)業(yè)熱潮,推動(dòng)產(chǎn)業(yè)向AGI快速進(jìn)化。
圍繞AGI的創(chuàng)業(yè)方向主要有:數(shù)據(jù)+大模型+應(yīng)用、數(shù)據(jù)+大模型+硬件等。本文所分析的三家企業(yè),不論是打造基礎(chǔ)設(shè)施的無問蒼穹、看好多模態(tài)理解的智子引擎,還是落地AI交通大模型的智慧互通和云天勵(lì)飛,關(guān)于AGI的終極猜想還是解決生產(chǎn)力問題,在落地部署、一線應(yīng)用、垂直細(xì)分領(lǐng)域,找到AI的大方向。